1. 课程的网址链接
课程地址:https://github.com/datawhalechina/hands-on-data-analysis https://gitee.com/datawhalechina/hands-on-data-analysis
B站视频:https://www.bilibili.com/video/BV1Uv411p77r
2. 关于numpy与pandas的介绍文档
User Guide — pandas 1.4.2 documentation
3. Pandas基础
1)逐块读取数据
df=pd.read.csv("data.csv",chunksize=1000)
df.get_chunk()
2)查看数据
df.describe() #查看数据的形式
df.tail() #查看末尾的几行
4. 相对路径载入报错时,尝试使用os.getcwd()查看当前工作目录
5. 关于Dataframe与Series的区别
Series是一种类似于一维数组的对象。它由一组数据(各种Numpy数据类型)以及一组与之相关的数据标签(即索引)组成。
df=Series()
DataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型值)。DataFrame既有行索引也有列索引,它可以被看做由Series组成的字典(共同用一个索引)。
df=DataFrame()