数据分析笔记（1）

最新推荐文章于 2022-05-04 10:12:24 发布

Fridayssss

最新推荐文章于 2022-05-04 10:12:24 发布

阅读量65

点赞数

分类专栏：笔记

本文链接：https://blog.csdn.net/weixin_57200091/article/details/118697990

版权

笔记专栏收录该内容

7 篇文章 0 订阅

订阅专栏

1.1.2.1绝对路径、相对路径

(1)相对路径,就是在同一个网站下,不同文件之间的的位置定位。引用的文件是相对当前网页的位置而言的,根据这个相对位置得出相对路径。
(2)绝对路径,指的是完整的路径。—Baidu

以文中提到的两种方法为例:

#相对路径
df = pd.read_csv('train.csv')
df.head(3)

#绝对路径
df = pd.read_csv('/Users/chenandong/Documents/datawhale数据分析每个人题目设计/招募阶段/第一单元项目集合/train.csv')
df.head(3)

其中下方阅读报错，依据os.getcwd()得其路径：
‘c:/Users/69434/Desktop/Program/组队学习/数据分析/hands-on-data-analysis-master/第一单元项目集合/train.csv’
修改路径后成功

注：python 的 os
模块可提供非常丰富的方法用来处理文件和目录。

若将csv文件放入绝对路径中的名为1 的文件夹中，绝对路径小小修改一下也可成功读出
在这里插入图片描述
1.1.2.2read_csv和read_table
当我们用的不是read_csv 而是read_table加载数据时：

二者输出不同的原因在于定界符不同。
在read_csv（）中，读取csv文件，定界符为,
在read_table（）中，读取tsv文件，定界符为\ t

但仍可以通过区别符设置的方法来转换

df_tsv_sep = pd.read_csv('./data/03/sample_header_index.tsv', 
							index_col=0, sep='\t')
print(df_tsv_sep)
#         a   b   c   d
# ONE    11  12  13  14
# TWO    21  22  23  24
# THREE  31  32  33  34
————————————————
此代码转载自CSDN博主「饺子大人」
https://blog.csdn.net/qq_18351157/article/details/104749945

pandas.chunker函数主要用于逐块读取数据。

chunker = pd.read_csv('train.csv', chunksize=50)#每50个数据读取一次
for chunk in chunker:
    print(chunk) #输出形式为每五十个数据一次

Fridayssss

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
数据分析笔记（1）

1.1.2.1绝对路径、相对路径(1)相对路径,就是在同一个网站下,不同文件之间的的位置定位。引用的文件是相对当前网页的位置而言的,根据这个相对位置得出相对路径。(2)绝对路径,指的是完整的路径。—Baidu以文中提到的两种方法为例:#相对路径df = pd.read_csv('train.csv')df.head(3)#绝对路径df = pd.read_csv('/Users/chenandong/Documents/datawhale数据分析每个人题目设计/招募阶段/第一单元项目集
复制链接

扫一扫

专栏目录