数据分析笔记(1)

1.1.2.1绝对路径、相对路径

(1)相对路径,就是在同一个网站下,不同文件之间的的位置定位。引用的文件是相对当前网页的位置而言的,根据这个相对位置得出相对路径。
(2)绝对路径,指的是完整的路径。—Baidu

以文中提到的两种方法为例:

#相对路径
df = pd.read_csv('train.csv')
df.head(3)
#绝对路径
df = pd.read_csv('/Users/chenandong/Documents/datawhale数据分析每个人题目设计/招募阶段/第一单元项目集合/train.csv')
df.head(3)

其中下方阅读报错,依据os.getcwd()得其路径:
‘c:/Users/69434/Desktop/Program/组队学习/数据分析/hands-on-data-analysis-master/第一单元项目集合/train.csv’
修改路径后成功

注:python 的 os
模块
可提供非常丰富的方法用来处理文件和目录。

若将csv文件放入绝对路径中的名为1 的文件夹中,绝对路径小小修改一下也可成功读出
在这里插入图片描述
1.1.2.2read_csv和read_table
当我们用的不是read_csv 而是read_table加载数据时:
在这里插入图片描述

二者输出不同的原因在于定界符不同。
在read_csv()中,读取csv文件,定界符为,
在read_table()中,读取tsv文件,定界符为\ t

但仍可以通过区别符设置的方法来转换

df_tsv_sep = pd.read_csv('./data/03/sample_header_index.tsv', 
							index_col=0, sep='\t')
print(df_tsv_sep)
#         a   b   c   d
# ONE    11  12  13  14
# TWO    21  22  23  24
# THREE  31  32  33  34
————————————————
此代码转载自CSDN博主「饺子大人」
https://blog.csdn.net/qq_18351157/article/details/104749945

pandas.chunker函数主要用于逐块读取数据。

chunker = pd.read_csv('train.csv', chunksize=50)#每50个数据读取一次
for chunk in chunker:
    print(chunk) #输出形式为每五十个数据一次
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值