此文总结如何使用 pandas
读取 csv
文件的指定行、列或元素。
Last Modified Date: 2022 / 6 / 17
示例数据
参考1,使用 pandas
读取 csv
示例数据:
data = pd.read_csv(filepath_or_buffer=path, header=None)
print(data.columns)
# Int64Index([0, 1, 2], dtype='int64')
print(data.index.names)
# [None]
print(data)
# 0 1 2
# 0 ABCD NaN All
# 1 EFGH NaN All
# ...
# 1657 OPQR NaN All
# 1658 XYZN NaN All
[1659 rows x 3 columns]
列
指定标签
单列
loc
col_0 = data.loc[:, 0]
# 提取第1列的内容
# 其他列,以此类推
pd.read_csv(..., usecols=[])
col_0 = pd.read_csv(filepath_or_buffer=path, header=None, usecols=[0])
# 为了确保读到的数据是正确的,可以写入excel,然后查看写入的数据
# writer = pd.Excelwriter('./trial.xlsx')
# data.to_excel(writer, index = False, header = False)
# writer.save()
np.array
col_0 = np.array(data[0])
# 第1列数据将会以数组形式存储
行
pd.read_csv(..., nrows=10)
row_0to10 = pd.read_csv(filepath_or_buffer=path, header=None, nrows=10)
# 只读取前10行
pd.read_csv(...,skiprows=9, nrows=5)
row_10to15 = pd.read_csv(..., skiprows=9, nrows=5)
# 忽略前9行,往下读5行