数据分析第一课
什么是数据分析
-是把隐藏在一些看似杂乱无章的数据背后的信息提炼出来,总结出所研究对象的内在规律
- 使得数据的价值最大化
- 分析用户的消费行为
- 制定促销活动的方案
- 制定促销时间和力度
- 计算用户的活跃度
- 分析产品的回购力度
- 决定投放时间
- 制定广告定向人群方案 决定相关平台的投放
- …
- 数据分析是用适当的方法对收集来的大量数据进行分析,帮助人们做出判断,以便采取适当的行动
- 保险公司从大量赔付申请数据中判断哪些为骗保的可能
- 支付宝通过从大量的用户消费记录和行为自动调整花呗的额度
- 短视频平台通过用户的点击和观看行为数据针对性的给用户推送喜欢的视频
数据分析三剑客
- numpy
- pandas(重点)
- matplotlib
本节课重点学习了numpy
NumPy(Numerical Python) 是 Python 语言中做科学计算的基础库。重在于数值计算,也是大部分Python科学计算库的基础,多用于在大型、多维数组上执行的数值运算。
导入numpy
-
使用array()创建一个一维数组
多维数组即列表嵌套格式
数组和列表的区别是什么?
数组中存储的数据元素类型必须是统一类型
优先级:
字符串 > 浮点型 > 整数 -
将外部的一张图片读取加载到numpy数组中,然后尝试改变数组元素的数值查看对原始图片的影响
-
将数组中的数据进行图像展示
-创立随机数组
-
固定随机性
numpy的常用属性
shape(img_arr.shape #形状)
ndim (img_arr.ndim #维度)
size (img_arr.size #返回元素个数)
dtype (img_arr.dtype #数组元素类型)
numpy的索引及切片
索引操作和列表同理
切片(行,列)
-
切出数组前两行
-
切出数组前两列
-
切出前两行的前两列
-
行翻转
-
列翻转
行列都翻转
- 图片翻转 (图片是三维数组)
- 图片裁剪
1.估读数值
2.裁剪
变形reshape
变成一列
二维变一维
级联操作
将多个numpy数组进行横向或者纵向的拼接
axis轴向的理解r
- 0:列 1:行
常用聚合操作 - sum,max,min,mean
常用数学函数
np.sin()
np.cos()
np.tan()
np.around(a,decimals) 舍入的小数位数。 默认值为0。 如果为负,整数将四舍五入到小数点左侧的位置