optimize the row-position read performance of TsFileDataFrame by ycycse · Pull Request #794 · apache/tsfile

ycycse · 2026-04-25T06:38:35Z

This PR optimizes Python TsFileDataFrame / Timeseries row-position reads.

Before this change, single-series position reads used row-by-row ResultSet.next() iteration. This PR switches that path to native row-query Arrow batch reads and avoids timestamp materialization when the caller only needs values.

TsFile direct reads improve from 143.2 to 536.2 samples/s, about 3.7x faster after this pr.

ycycse added 3 commits April 25, 2026 02:14

optimize read performance

0f02fd3

remove unrelated optimization

b3383c4

spotless

eae1bea

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

optimize the row-position read performance of TsFileDataFrame#794

optimize the row-position read performance of TsFileDataFrame#794
ycycse wants to merge 3 commits intoapache:developfrom
ycycse:optimize-python-dataset-row-read

ycycse commented Apr 25, 2026

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

Conversation

ycycse commented Apr 25, 2026

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant