注:文章第二部分,pandas进行数据简单处理来自刘顺祥老师公众号:
数据分析1480(微信号:lsxxx2011)
数据框与文件读取部分
数据读取--from MySQL,CSV文件
通过MySQL读取
通过csv文件读取
数据集的描述describe()
不同的describe参数,返回不同的结果
借助pandas进行数据预处理,包括:
1、数据集变量与观测的筛选
2、变量重命名
3、数据类型的变换
4、排序
5、重复观测的删除
6、数据集的抽样
一、数据筛选
<