数据分析大概就是利用一些工具对一些数据的进行提取然后再分析。
工具:python,numpy库,pandas库
- 载入数据
pandas.read_csv() - 查看数据
head(),info(),tail(),columns - 导出
to_csv() - 数据类型
DataFrame(表格,本章数据类型),Series(索引-值) - 删除数据
del/drop - 筛选
midage=df[(df[‘年龄’]>=10)&(df[‘年龄’]<50)]
midage.head()
midage.loc[[100,105,108],[‘仓位等级’,‘姓名’,‘性别’]] #显示第100,105,108行的"仓位等级","姓名"和"性别"的数据,下同
midage.iloc[[100,105,108],[2,3,4]]
- 排序
sort_values()
sort_index() - 加法
两个DataFrame相加后,会返回一个新的DataFrame,对应的行和列的值会相加,没有对应的会变成空值NaN - 查看数据统计信息
describe()