Python处理大数据3个技巧效率提升攻略

最新推荐文章于 2024-07-08 02:49:38 发布

Python方正

最新推荐文章于 2024-07-08 02:49:38 发布

阅读量1.6k

点赞数

文章标签： Python Python开发后端编程语言 Python基础

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45716111/article/details/102788425

版权

本文探讨了Python处理大数据的优缺点，并提供了解决效率问题的三个技巧：避免使用列表，利用文件属性增强唯一性，以及善用字典的iteritems()。对于大型文件读取，以'rb'模式打开文件并逐行处理能显著提高效率。尽管Python在处理大数据时可能存在效率挑战，但在特定场景下，结合其快速开发和丰富的数据处理库，仍是一种实用选择。

摘要由CSDN通过智能技术生成

如果你有个5、6 G 大小的文件，想把文件内容读出来做一些处理然后存到另外的文件去，你会使用什么进行处理呢？不用在线等，给几个错误示范：有人用multiprocessing 处理，但是效率非常低。于是，有人用python处理大文件还是会存在效率上的问题。因为效率只是和预期的时间有关，不会报错，报错代表程序本身出现问题了~

Python处理大数据的劣势：

1、python线程有gil，通俗说就是多线程的时候只能在一个核上跑，浪费了多核服务器

2、python执行效率不高，在处理大数据的时候，效率不高

3、绝大部分的大公司，用java处理大数据不管是环境也好，积累也好，都会好很多

Python处理数据的优势（不是处理大数据）：

1、异常快捷的开发速度，代码量巨少

2、丰富的数据处理包，不管正则也好，html解析啦，xml解析啦，用起来非常方便

3、内部类型使用成本巨低，不需要额外怎么操作（java，c++用个map都很费劲）

4、公司中，很大量的数据处理工作工作是不需要面对非常大的数据的

5、巨大的数据不是语言所能解决的，需要处理数据的框架（hadoop， mpi。。。。）虽然小众，但是python还是有处理大数据的框架的，或者一些框架也支持python

6、编码问题处理起来太太太方便了

结论：

1、python可以处理大数据

2、python处理大数据不一定是最优的选择

3. python和其他语言&#

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。