基础知识
数据的分类
-
数值型数据
-
表示大小或多少的数据
-
例子:年龄、年购买量
-
数值型数据分析方法
- 最小值和最大值:查看这两个值的目的是为了能够确定一组数据的上界和下界。
- 平均值:平均值可以反映一组数据的综合水平。
- 中位数:中位数和平均数一样都是用来反映整体数据综合水平的指标。
-
-
分类型数据
-
可以用标记或名称来识别项目的类型的数据
-
例子:用户id、性别、行业、岗位、购买原因
-
分类型数据分析方法
- 频率分布:频率分布反映的是一组数据中各个类别出现的次数占总数据的百分比,公式为
频数/总数据数
- 频率分布:频率分布反映的是一组数据中各个类别出现的次数占总数据的百分比,公式为
-
统计图
-
饼图
- 主要用于展示不同类别在整体中所占比重
- 在饼图中,整个圆饼代表数据的总量,各扇形区域表示各分类数据的占比,所有面积加和等于100%,可以很好地帮助用户了解整体的构成情况
- 饼图通常是展现分类型数据频率分布的最佳选择
- 缺点:不适用于多分类数据
-
条形图
- 是一种用来描绘分类型数据频数或频率分布的可视化图表
- 条形图使用一个单位长度表示一定长度的数量,根据数量的大小画成长短不同的直条。相较于饼图,条形图的优势体现在数据间的差异更直观。因为肉眼对高度差异更敏感
- 缺点:数据占比的展示不如饼图直观
- 对于频率分布的数据可视化,我们一般会优先使用饼图。但如果数据分类过多,我们可以选择条形图
-
直方图
- 直方图可以用来描绘数值型数据频数分布或频率分布的图表
- 针对数值型数据,直方图往往会比条形图有更好的可视化效果
- 直方图和条形图之间,最明显的区别就是,直方图的 “柱” 之间,是没有空隙的,而条形图的 “柱” 之间会有空隙。直方图的 “柱” 之间之所以没有空隙,因为数值型数据是连续的,没有空隙恰好能体现出其连续性
-
折线图
- 折线图一般是用来针对数值型数据进行分析的
- 折线图往往可以反映数值型数据的变化趋势
数据清洗
-
当数据同时存在缺失值、重复值以及异常值的问题时,这份数据属于脏数据,需要进行数据清洗。
- 在实际的数据分析项目中,经常会遇见数据统计不完整的情况,我们一般将那些缺失的数据称为缺失值
- 重复值指的是表格中重复出现的数据。在多数情况中,重复值都是完全相同的数据
- 有时数据中有一个或多个异常大或异常小的数值,超出了这份数据实际的限定范围,这样的数值被称为异常值
-
清洗数据的步骤:
- 处理缺失值
- 处理重复值
- 处理异常值
安装库
# 安装Pandas库
pip3 install pandas
# 安装matplotlib库
pip3 install matplotlib
Series对象与DataFrame对象
Series对象
# 一组数据+索引
import pandas as pd
data = pd.Series(['赵','钱','孙','李'])
print(data)
# 输出
0 赵
1 钱
2 孙
3 李
dtype: object
DataFrame对象
# 一组数据+行索引+列索引
import pandas as pd
data = pd.DataFrame({'年龄':[22,23,21],'专业':['计算机','数学','物理']})
print(data)
# 输出
年龄 专业
0 22 计算机
1 23 数学
2 21 物理
两者区别与联系
- 区别:索引不同
- 联系:
DataFrame
对象可以被看作有Series
对象构成
读取文件
import pandas as pd
my_data = pd.read_csv(
'./data.csv', # 文件路径
encoding = 'utf-8' # 编码格式
)
最后免费分享给大家一份Python全套学习资料,包含视频、源码,课件,希望能帮到那些不满现状,想提升自己却又没有方向的朋友。
关于Python技术储备
学好 Python 不论是就业还是做副业赚钱都不错,但要学会 Python 还是要有一个学习规划。最后大家分享一份全套的 Python 学习资料,给那些想学习 Python 的小伙伴们一点帮助!
一、Python所有方向的学习路线
Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
二、Python必备开发工具
这份完整版的Python全套学习资料已经打包好,需要的小伙伴可以戳下方链接免费领取
三、Python视频合集
观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
四、实战案例
光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
五、Python练习题
检查学习结果。
六、面试资料
我们学习Python必然是为了找到高薪的工作,下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料,并且有阿里大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。
这份完整版的Python全套学习资料已经打包好,需要的小伙伴可以戳下方链接免费领取