python描述性统计工作日上班时代码_Python 实现描述性统计

最新推荐文章于 2024-03-05 19:47:44 发布

weixin_39751871

最新推荐文章于 2024-03-05 19:47:44 发布

阅读量125

点赞数

文章标签： python描述性统计工作日上班时代码

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39751871/article/details/111433284

版权

1.生成数据

import numpy as np

import pandas as pd

from scipy import stats

form numpy.random import normal, randint

# 使用list 来创造一组数据

data1 = [1, 2, 3]

# 使用ndarray 来创造一组数据

data2 = np,ndarray([1, 2, 3])

# 使用series来创造一组数据

data3 = pd.Series([1, 2, 3])

# 创造一组正太分布的数值型数据

data4 = normal(0, 1, size = 10)

# 创造一组均匀分布的分类数据

data5 = randint(0, 10, size = 20)

2. 集中趋势

2.1 均值

# numpy 实现

np.mean(data4)

2.2 中位数

# numpy 实现

np.median(data5)

2.3 众数

# numpy 实现

counts = np.bincount(data5)

mode_val = np.argmax(counts)

# scipy 实现

print(stats.mode(data5)[0][0])

3. 离散程度

3.1 极差

# numpy 实现

np.ptp(data4)

3.2 方差

# numpy 实现

np.var(data4)

3.3 标准差

# numpy 实现

np.std(data4)

3.4 变异系数

# numpy 实现

np.std(data4) / np.mean(data4)

4. 偏差程度

z-分数

# 计算data4数据中第1个值的Z-分数

print((data4[0] - np.mean(data4)) / np.std(data4))

# array一组数同时进行计算Z-分数

(data4 - np.mean(data4)) / np.std(data4)

# 求出data3整列数据的Z-分数

data3_zscore = (data3 - np.mean(data3)) / np.std(data3)

5. 相关程度

5.1 协方差

# numpy 实现

data = np.array([data4, data5])

np.cov(data, bias = 1)

5.2 相关系数

# numpy 实现

data = np.array([data4, data5])

np.corrcoef(data)

6.pandas 表格概括性统计描述

# 生成数据

table_df = pd. DataFrame({

'收入' : [np.nan, 10000, 20000, 9000, 14000],

'性别' : [ '男', '男', '女', '男', '男'],

'年龄' : [23, 29, 24, 27, 29],

'职业' : ['审计', ‘数据分析', '公务员', '法务', '产品经理' ]

})

# 查看表格的概括性统计描述 (默认只有数值型)

table_df.describe()

# 查看表格的所有列概括性描述

table_df.describe(include = 'all')

# 查看类别变量列的描述信息

table_df.describe(include = 'object')

# 查看各列数据类型

table_df.dtypes

weixin_39751871

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python描述性统计工作日上班时代码_Python 实现描述性统计

1.生成数据import numpy as npimport pandas as pdfrom scipy import statsform numpy.random import normal, randint# 使用list 来创造一组数据data1 = [1, 2, 3]# 使用ndarray 来创造一组数据data2 = np,ndarray([1, 2, 3])# 使用series来创造...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。