数据分析学习总结
通过学习的书本、视频、实战过程中遇到的问题或者需要记录的笔记。
江大王
这个作者很懒,什么都没留下…
展开
-
实战1--航空公司客户价值分析(数据清洗篇)
根据所获得的数据,处理不符合实际情况的数据 处理方法: 直接丢弃异常值(包括重复数据 Pandas:drop()/dropna()/drop_duplicated() 用一个新的属性、值替代原值(中位数、众数等) Pandas:fillna() 针对连续型的数值,可以用插值 Pandas:interpolate() 小数据练习处理错误数据 import pandas as pd df = pd.DateFrame({'A':[1,2,3,4,5,6],'B'['B1','B2','B3','B4']}原创 2020-07-07 15:57:08 · 1041 阅读 · 0 评论 -
实战1--航空公司客户价值分析(画图篇)
数据基本信息的探索 第一步:根据数据的实际情况的掌握(数据的空值数量,最大值,最小值,四分位等等) # 对数据进行基本的探索 import pandas as pd # 第一行为标签 data_file = '读取文件地址' # 数据探索结果表 result_file = '.结果存入地址' # 需要用文本编辑器将数据转换为UTF-8编码 data = pd.read_csv(data_file, encoding='utf-8') # 包括对数据的基本描述使用discribe()函数;percentil原创 2020-07-02 19:39:53 · 1878 阅读 · 2 评论