Python pandas 数据清洗与数据绘图实战

wespten

已于 2023-04-18 05:50:01 修改

阅读量741

点赞数

分类专栏： Python Go AI 人工智能机器学习语言处理文章标签： python 开发语言数据分析

于 2023-04-16 12:31:44 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_35029061/article/details/130138148

版权

Python Go AI 人工智能机器学习语言处理专栏收录该内容

113 篇文章 33 订阅 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

1、Python数据探索

Python已成为数据科学的主要语言之一，并继续在数据科学领域不断壮大。如前所述，就原始性能而言，Python并不总是速度最快的语言。但是有些数据处理库（如NumPy）主要用C语言编写，并且经过大量优化，以至于速度不再是问题。

此外，对可读性和可访问性的考虑往往超过了纯粹的速度需求，最大程度地节省开发人员的时间往往更为重要。Python具有较好的可读性和可访问性，并且无论是单独使用还是与Python社区开发的工具相结合，都是极其强大的数据操作和探索工具。

数十年来，电子表格一直是即兴（ad-hoc）数据处理的首选工具。熟悉电子表格的人能够发挥出着实惊人的技巧，可以组合有关联的不同数据集、数据透视表，可以用查找表链接数据集等。尽管每天到处都有人用电子表格完成了大量工作，但它确实存在局限性，Python就能有助于超越这些限制。

之前已经提到过的一个限制是，大多数电子表格软件都有行数限制，目前大约是100万行，这对于许多数据集来说是不够用的。另一个限制就是电子表格本身的寓意。电子表格是二维网格，就是行和列，顶多也就是一堆的网格，这限制了复杂数据的操作与思维方式。

有了Python，就可以绕开电子表格的限制编写代码，按照希望的方式操作数据。可以用无限灵活的方式组合Python数据结构，如列表、元组、集合和字典，或者可以创建自己的类，完全根据需要将数据和行为打包在一起。

2、Jupyter记事本

这或许算是最引人注目的Python数据探索工具之一，不会增加语言本身的功能，但会改变Python与数据的交互方式。

Jupyter记事本是一种通过Web浏览器访问Python的实用方式

了解本专栏

超级会员免费看

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
Python pandas 数据清洗与数据绘图实战

熟悉电子表格的人能够发挥出着实惊人的技巧，可以组合有关联的不同数据集、数据透视表，可以用查找表链接数据集等。必须要清楚的是，这里有很多操作其实并不属于pandas本身的功能，pandas有赖于安装的其他库来处理这些操作，例如，SQL数据库的读取就是用SQLAlchemy完成的。在探索和操作数据的过程中，需要执行很多的常见操作，例如，将数据加载到列表或字典中、清洗数据并过滤数据。现在应该关注的重点是，在一行数据中，观测站ID是前11个字符，年份是后面4个字符，月份是再后面两个字符，元素是再后面4个字符。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

wespten 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。