1.1.2.1绝对路径、相对路径
(1)相对路径,就是在同一个网站下,不同文件之间的的位置定位。引用的文件是相对当前网页的位置而言的,根据这个相对位置得出相对路径。
(2)绝对路径,指的是完整的路径。—Baidu
以文中提到的两种方法为例:
#相对路径
df = pd.read_csv('train.csv')
df.head(3)
#绝对路径
df = pd.read_csv('/Users/chenandong/Documents/datawhale数据分析每个人题目设计/招募阶段/第一单元项目集合/train.csv')
df.head(3)
其中下方阅读报错,依据os.getcwd()得其路径:
‘c:/Users/69434/Desktop/Program/组队学习/数据分析/hands-on-data-analysis-master/第一单元项目集合/train.csv’
修改路径后成功
注:python 的 os
模块可提供非常丰富的方法用来处理文件和目录。
若将csv文件放入绝对路径中的名为1 的文件夹中,绝对路径小小修改一下也可成功读出
1.1.2.2read_csv和read_table
当我们用的不是read_csv 而是read_table加载数据时:
二者输出不同的原因在于定界符不同。
在read_csv()中,读取csv文件,定界符为,
在read_table()中,读取tsv文件,定界符为\ t
但仍可以通过区别符设置的方法来转换
df_tsv_sep = pd.read_csv('./data/03/sample_header_index.tsv',
index_col=0, sep='\t')
print(df_tsv_sep)
# a b c d
# ONE 11 12 13 14
# TWO 21 22 23 24
# THREE 31 32 33 34
————————————————
此代码转载自CSDN博主「饺子大人」
https://blog.csdn.net/qq_18351157/article/details/104749945
pandas.chunker函数主要用于逐块读取数据。
chunker = pd.read_csv('train.csv', chunksize=50)#每50个数据读取一次
for chunk in chunker:
print(chunk) #输出形式为每五十个数据一次