Joyful Pandas:Content — Joyful Pandas 1.0 documentation
一、数据加载
1.载入数据
1.1导入numpy和pandas
import numpy as np
import pandas as pd
1.2载入数据
使用相对路径载入数据
使用绝对路径载入数据
1.3逐块读取
chunker=pd.read_csv('./train.csv',chunksize=1000)
for i in chunker:
print(i)
1.4更换中文表头,索引
2.初步观察
2.1查看数据基本信息
df.info()
2.2观察表格某一部分数据
df.head()
df.tail()
2.3判断数据是否为空
df.isnull()
3.保存数据
df.to_csv('-n.csv')
二、pandas基础
1.查看数据每列名称
df.columns
2.查看某一列所有值
df. .head()
3.删除或隐藏元素
4.逻辑的筛选
三、探索性数据分析
1.利用pandas对示列数据进行排序
2.利用pandas进行算术计算,计算两个dataframe数据相加结果
3.通过泰坦尼克号数据计算出在船上最大的家族有多少人
4.使用pandas describe()函数查看数据基本统计信息
5.分析数据
四、口袋妖怪数据集数据处理
使用conda新建姓名首字母字母缩写的python环境
将列名更换为中文
分别存储单属性与双属性的妖怪 存储为不同csv文件
对于#重复的妖怪只保留第一条记录 并求出第一属性的种类数量和前三数量对应的种类
求第一属性和第二属性的组合种类
找出Total, HP, Attack, Defense, Sp. Atk, Sp. Def, Speed的最大值,平均值,方差,中位数
将HP超过100的替换为high,不足50的替换为low,否则设为mid
对total值进行降序排序并存储为csv文件