pandas系列:
1.创建pandas
2.索引、切片、筛选
3.初步探索pandas
4.清洗pandas
5.高级处理pandas
6.时间序列
7.绘图
pandas和matplotlib是数据分析中最基础的python库了。接下来就是机器学习,回归、聚类、分类、关联规则等…
一.3种创建DataFrame的方法
1.使用列表创建DataFrame
添加columns和index名称
2.使用字典创建DataFrame
3.使用数据读取创建DataFrame
超级简单有没有,想要导入一个excel文件,直接一句话pd.read_excel,然后excel就出现了,csv文件也是同理。
最简单的是pd.read_clipboard,你Ctrl+C复制一个表格,然后输入这句,表格就直接出现了。
同理,把表格转出成excel、csv也很简单,只要fruits.to_excel就可以了。
二.DataFrame的索引、切片和筛选
1.使用[ ]
[]索引的是列,并且必须使用列名。即df[col_name]。
如果col_name中间没有空格,也可直接使用df.col_name。如df['age']等同于df.age
- 索引单行列
- 索引多行列:
- []进行筛选
2.使用df.loc
- df.loc索引行和列,但必须使用行名称和列名称,df.loc[index_name,col_name]
- 同时索引行和列(行、列用逗号隔开):
- df.loc进行切片
- df.loc行和列都进行索引
- df.loc进行筛选
- 注:这里的多列使用一个方括号即可
3.使用df.iloc
- 类似loc,不同之处在于loc使用行列名称,iloc使用行列位置索引
- df.iloc进行切片
- df.iloc进行行列同时切片
- df.iloc进行筛选
————————分割线———————
具体解释和运行结果都放在公众号里了,懒得贴上来了,哈哈哈哈~