首先我使用的是jupyter notebook,要实现python的pandas库对CSV文件的操作,首相肯定需要导入库,然后就是要拥有一个CSV文件的样本啦,因为CSV文件的数据样本很多人可能没有,所以我是直接搜索的成绩单样本,然后写一些简单的脚本从百度文档爬取得到的。
现在开始进入流程:
先导入pandas库:
import pandas as pd
df = pd.read_csv('C:/Users/asus/Desktop/data.csv')
调用pandas库中的read_csv函数,读取电脑上的csv文件,如果是使用的jupyter notebook的话,可以尝试在‘ '中写入地址时,输入 ~/ 再按tab键可以获取地址提示,看看效果:
获取列名与索引:
# 列名
print(df.columns)
# 索引
print(df.index)
按照某一列筛选:
按照某一列或者某几列进行排序:
其中的head函数不加任何参数的话就是默认取前5列。
取出某一列的值(返回值为array数列):
简单的个数统计:
将表格中的某几列拆分出来:
pandas中的map函数:
pandas中的applymap函数:
索引(前面的索引并不都是从0开始步长为1的,有时候会有一些特殊的索引,如下图):
这次的分享就到这里,希望能给大家带来一些帮助,人生苦短,我用python!感谢大家的阅读!