python中numpy包_利用python的Pandas和numpy包进行数据分析

最新推荐文章于 2022-02-19 20:51:04 发布

wongzo

最新推荐文章于 2022-02-19 20:51:04 发布

阅读量460

点赞数 1

文章标签： python中numpy包

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_36301296/article/details/113500868

版权

本文包含了利用python中的numpy包和pandas包实践数据分析和数据清洗工作，其中共有两个案列，朝阳医院的销售案例和拉勾网的求职招聘案例

学习步骤：

1.掌握numpy和pandas中参数的用法

#numpy用于数学计算

#pandas是基于numpy的数据分析包，提供了一套名为数据框的数据结构，可以方便的对表结构数据进行分析

#matplotlib是一个图形绘制库，用于图形数据分析的可视化

2. 导入Excel数据，本文列出两种

3.清洗数据- 1)截取数据

2)查看数据是否有异常值

3)删除无用的字符串，列，空值，重复数据

4)重新排序

5)重命名索引

以下来自我的 Jupyter Notebook 笔记，更多详细内容请访问笔记，其中有医院案例分析和拉勾网的数据分析http://note.youdao.com/noteshare?id=aeb875c4c7b2719e274ff7c5391f5f2cnote.youdao.com

import pandas as pd

imy_dfmport numpy as np

import warnings; warnings.simplefilter('ignore')

%matplotlib inline

import matplotlib.pyplot as plt

#一维数组

a = np.array([1,2,3,4,5])

#查询元素

print(a[0])

#切片访问

print(a[1:4])

#循环访问

for i in a:

print(i,end=',')

#查看数据类型

print('数据类型为:', a.dtype)

#运算

print('平均值为:', a.mean())

#标准差

print('标准差为:', a.std())

b = np.array([2,3,4])

c = b*5

print(c)

#pandas 一维数组，index参数用于指定每个元素的索引, Series中的 'S' 要大写

x = pd.Series([54,190,173,1050,181,1137], index = ['腾讯','阿里巴巴','苹果','谷歌','脸书','亚马逊'])

pr

最低0.47元/天解锁文章

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
python中numpy包_利用python的Pandas和numpy包进行数据分析

本文包含了利用python中的numpy包和pandas包实践数据分析和数据清洗工作，其中共有两个案列，朝阳医院的销售案例和拉勾网的求职招聘案例学习步骤：1.掌握numpy和pandas中参数的用法#numpy用于数学计算#pandas是基于numpy的数据分析包，提供了一套名为数据框的数据结构，可以方便的对表结构数据进行分析#matplotlib是一个图形绘制库，用于图形数据分析的可视化2. 导...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。