今天学习了有关pandas的数据处理指令,在这里简单记录一下
1.read csv
在pandas中有几种读取csv数据的方式
1.1
import pandas as pd
pd.read_csv(“girl.csv”)
1.2
pd.read_csv(“http://localhost/girl.csv”)
1.3
f = open(“girl.csv”, encoding=“utf-8”)
pd.read_csv(f)
1.4
import tempfile
import pandas as pd
tmp_file = tempfile.TemporaryFile(“r+”)
tmp_file.write(open(“girl.csv”, encoding=“utf-8”).read())
tmp_file.seek(0)
pd.read_csv(tmp_file)
关联数据表
pd.merge
提取列
pd.DataFrame(表名,列=【】)
查看
pd.head()
查看数据信息
3.1 shape
查看数据规模 多少行 多少列
3.2 info
查看整体数据信息,包括每个字段的名称、非空数量、字段的数据类型
3.3 describe
查看数据表中数据类型的列的数据分布情况
4.数据处理
4.1 空值填充
#空值处理,统一填充 NOT PROVIDED
c_itcont[‘STATE’].fillna(‘NOT PROVIDED’,inplace=True)
c_itcont[‘EMP