Python数据分析之:Pandas的基本数据分析功能


Pandas 是 Python数据分析的强有效的库,主要通过 Series 结构和 DataFrame 结构来进行数据表格的创建,并通过其内置的一些函数进行数据的统计和分析。

1. pandas 创建 Series 格式数据

import pandas

pd = pandas.Series([4,5,6,7],['1','2','3','4'])
print(pd)


在这里插入图片描述

2. pandas 创建 dataframe 格式数据

import pandas as pd
data = pd.DataFrame([1,2],['0','1'],['data'])

print(data)

在这里插入图片描述
或者:

import pandas as pd
lst = [list(range(1,5)),list(range(6,10))]
data = pd.DataFrame(lst,['0','1'],['data1','data2','data3','data4'])

print(data)

在这里插入图片描述
PS: pandas 的 dataframe结构任意取出一行或者一列,其结构都是 Series。

3. 使用pandas内置函数来分析数据

3.1 describe()

import pandas as pd
lst = [list(range(1,5)),list(range(6,10))]
data = pd.DataFrame(lst,index=['0','1'],columns=['data1','data2','data3','data4'])
describe = data.describe()
print(describe)

在这里插入图片描述
describe()函数最终会呈现每一列数据的count(非空值的个数)、mean(这一列的均值)、std(这一列的标准差)、min(最小值)、25%(下四分位数)、50%(中位数)、75%(上四分位数)、max(最大值)

3.2 var / sum

import pandas as pd
lst = [list(range(1,5)),list(range(6,10))]
data = pd.DataFrame(lst,index=['0','1'],columns=['data1','data2','data3','data4'])
describe = data.describe()
var = data.var()            #求方差
sum = data.sum()            #求和
print(var,'\n',sum,'\n')

在这里插入图片描述

3.3 求相关性 corr

相关性的标准有 Pearson 和 spearman等

import pandas as pd
data = pd.DataFrame([range(1,8),range(2,9)])
print(data)
s1 = data.loc[0]
s2 = data.loc[1]
data.corr(method='pearson')
corr = s1.corr(s2)
print(corr)

在这里插入图片描述

3.4 计算协方差 cov

import pandas as pd
import numpy as np
data = pd.DataFrame(np.random.randn(6,5))
print(data,'\n')
cov = data[0].cov(data[1])
print(cov)

在这里插入图片描述

3.5 skew 偏度(三阶矩)/kurt 峰度(四阶矩)

import pandas as pd
import numpy as np
data = pd.DataFrame(np.random.randn(6,5))
print(data)
print(data.skew())
print(data.kurt())

在这里插入图片描述

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

暖仔会飞

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值