数据研发学习笔记07:利用Python对数据进行描述性统计

1.1 集中趋势

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

1.1 均值

在这里插入图片描述

1.2 中位数

在这里插入图片描述

1.3 众数

(1)使用numpy
在这里插入图片描述
(2)直接利⽤scipy下stats模块【推荐】
在这里插入图片描述

2 离散趋势

在这里插入图片描述

2.1 极差

在这里插入图片描述

2.2 四分位数

在这里插入图片描述

2.3 四分位数极差(四分位距)

在这里插入图片描述

2.4 五数概括

在这里插入图片描述

2.5 箱线图

(1)单一箱线图
在这里插入图片描述
(2)多个箱线图
在这里插入图片描述
在这里插入图片描述

2.6 方差和标准差

在这里插入图片描述
在这里插入图片描述

2.7 DataFrame描述性统计

在这里插入图片描述

3 基本统计图

在这里插入图片描述

3.1 条形图

在这里插入图片描述

3.2 饼状图

在这里插入图片描述

3.3 折线图

在这里插入图片描述

3.4 直方图

在这里插入图片描述

3.5 散点图

在这里插入图片描述

3.6 分位数-分位数图

在这里插入图片描述

4 高级绘图

4.1 雷达图

在这里插入图片描述

4.2 词云图

(1)安装包

pip install wordcloud
pip install jieba

(2)绘制词云
使⽤数据为2019年政府⼯作报告全⽂
⽂件:“政府⼯作报告2019.txt”
原⽂地址:http://www.gov.cn/zhuanti/2019qglh/2019lhzfgzbg/index.htm
在这里插入图片描述

5 计算数值属性的三种距离

在这里插入图片描述
在这里插入图片描述

5.1 欧氏距离

在这里插入图片描述

5.2 曼哈顿距离

在这里插入图片描述

5.3 明可夫斯基距离

在这里插入图片描述

展开阅读全文

没有更多推荐了,返回首页

©️2019 CSDN 皮肤主题: 游动-白 设计师: 上身试试
应支付0元
点击重新获取
扫码支付

支付成功即可阅读