python数据分析---基础篇

最新推荐文章于 2024-09-23 14:24:34 发布

oooost

最新推荐文章于 2024-09-23 14:24:34 发布

阅读量50

点赞数 1

文章标签： python 数据分析开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_74112035/article/details/133825838

版权

一、pandas的Series库引用示例：

import pandas as pd

data = [22222,44444,22221,6767676,555555]

city = ['GD','JS','SH','SZS','LYG']

GDP = pd.Series(data,index=city)

print(GDP)

二、pandas的DataFrame库引用示例：

import pandas as pd

data= {'rank':[1, 2, 3, 4],'GDP':[80855, 77388, 68024, 47251]}

city= ['GD','JS','SD','ZJ']

df= pd.DataFrame(data, index=city)

print(df)

三、它们都共有3种属性

1..dtypes---->导出类型

2..index---->导出索引

3..values---->导出值

四、pandas中读取CSV文件主要使用：

1.pd.read_csv()函数

将文件路径传入，经过处理后可得到DataFrame格式的数据

行索引：index

列索引：columns

2.CSV的文件路径：

使用Windows系统的同学在自己的电脑上运行代码时，需要注意路径前要加一个r表示字符串不需要转义。

如：

pd.read_csv(r"D:\Users\数据管理.csv")

需要得到：

import pandas as pd

data = pd.read_csv("/Users/数据管理.csv")

print(data)

注意：

1.防止乱码

使用pd.read_csv()方法读取csv格式文件的时候，常常会因为csv文件中带有中文字符造成读取文件错误。

此时，我们可以将参数encoding设置为"utf-8"。

格式：encoding="utf-8"

2.指定index - index_col

对于这种情况，pd.read_csv()函数提供了一个参数：index_col，将列名作为字符串传入该参数便可以指定index。

在这里，我们指定 "order_id" 这一列作为index。具体代码如下：

使用pd.read_csv()函数读取路径为 "/Users/数据管理.csv" 的CSV文件

并通过参数index_col来指定"order_id"列为index

将结果赋值给变量data,

data=pd.read_csv("/Users/数据管理.csv",index_col="order_id")

3. 读取指定列 - usecols

针对只需要读取数据中的某一列或多列的情况，pd.read_csv()函数提供了一个参数：usecols，将包含对应的columns的列表传入该参数即可。

比如，只读取 "payment" 和 "items_count" 这两列数据的具体代码如下：

TODO 使用pd.read_csv()函数和usecols参数

读取路径为 "/Users/数据管理.csv" 的CSV文件里：

"payment"和"items_count"这两列中的数据

并将结果赋值给变量data

data=pd.read_csv("/Users/数据管理.csv",usecols=["payment","items_count"])

4. 添加columns

如果CSV文件没有列名，那么使用pd.read_csv()函数就是从第一行直接开始数据的录入了。

这时，就需要给数据添加上columns，让数据变得完整。

TODO 使用pd.read_csv()函数、header参数和names参数

读取路径为 "/Users/order_withoutColumns.csv" 的CSV文件

将数据的columns设置为:"订单号","用户id","支付金额","商品价格","购买数量","支付时间"

将结果赋值给变量data

data = pd.read_csv("/Users/order_withoutColumns.csv",header=None,names=["订单号","用户id","支付金额","商品价格","购买数量","支付时间"])

小结：

1. 防止乱码 - encoding="utf-8"

2. 指定index - index_col

3. 读取指定列 - usecols

4. 添加columns - header=None 和 names

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

oooost CSDN认证博客专家 CSDN认证企业博客

码龄2年

16: 原创

88万+: 周排名

7万+: 总排名

6702: 访问

: 等级

287: 积分

91: 粉丝

127: 获赞

8: 评论

120: 收藏

私信

关注

热门文章

分类专栏

python基础 4篇

最新评论

cs61A---2020fall‘s recording---Day 1
CSDN-Ada助手: 恭喜您写了第10篇博客！持续创作不易，能够坚持下来真的很了不起。对于接下来的创作，我建议您可以尝试加入一些个人的见解和思考，让读者更容易产生共鸣。当然，这只是我的一点建议，希望对您有所帮助。期待看到您更多精彩的作品！
python--函数
CSDN-Ada助手: 恭喜您发布了新的博客文章！看到您分享关于Python函数的内容，我感到非常兴奋。您对于这个主题的深入讨论让我受益匪浅。希望您能继续保持创作的热情，继续分享更多关于Python的知识和经验。或许下一步可以考虑分享一些实际案例或者高级技巧，让读者们能够更深入地理解函数的应用。期待您更多精彩的作品！
python--字典2
CSDN-Ada助手: 恭喜您发布了新的博客，继续分享关于python字典的知识。我觉得您可以考虑在下一篇博客中加入一些实际案例或者应用场景，这样读者更容易理解和运用。希望您能继续保持创作的热情，期待您的下一篇作品！
python--字典1
CSDN-Ada助手: 恭喜您发布了第7篇博客，“python--字典1”！您的持续创作展现了您对Python编程的热情和执着，让人十分钦佩。在下一步的创作中，或许可以考虑深入探讨字典的高级应用或者与其他数据结构的比较，这样可以为读者提供更多的学习参考。希望您能继续保持创作的热情，为大家带来更多有价值的内容！
python练习小程序
CSDN-Ada助手: 恭喜您发布了新的博客！看到您在分享Python练习小程序，真是让人感到很兴奋。希望您能继续保持创作的热情，不断分享更多有趣的内容。或许下一步可以考虑分享一些实际应用场景下的Python小程序，让读者更加深入地了解Python的强大之处。期待您的下一篇作品！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。