- 博客(1)
- 资源 (14)
- 收藏
- 关注
原创 Spark初体验
spark 很秀,号称比hadoop快很多,虽然是内存运行,但是即使在磁盘上运行,也比MapReduce快不少。 官网上也是一点不低调,有图为证 其架构大致如下 spark sql 操作数据化结构的程序包 spark streaming 对实时数据进行流式计算的组件 MLlib 提供常见的机器学习程序库 GraphX 操作图,进行并行的图计算 spark做计算主要是对RDD进...
2018-04-06 21:03:11 186
manage_files.zip
对某个目录下的文件进行统计,自动扫描出来文件列表进行显示,文件的名字,大小,最近修改时间,位置 然后可以在列表中选中并且删除 python3实现,有图形化界面可以直接操作,也附加源码可以修改调试学习使用
2020-07-21
delete_empty_files.zip
支持删除所有的空文件夹,python3实现,附加源码,有图形化界面 可直接运行
走过路过不要错过 非递归方式实现文件夹扫描,值得学习的小例子
2020-07-21
user_analysis.py
淘宝用户分析代码,对数据进行预处理,包括缺失值、异常值和重复值的处理,统计基础数据:总浏览量、总用户数、有购买行为的用户数、复购率、跳失率各为多少?用户行为之间相互转化率是多少?用户对商品有哪些购物偏好?用户购买行为最活跃的时段和日期是什么时候?通过用户分组找出哪些是价值用户?
2020-07-08
leetcode刷题指南
leetcode刷题指南,官方发布的 里面都是最优解答,有些题目在leetcode中需要付费才能查看的。虽然只有50道题目,但是包含了各类别的习题,多做多思考,必有所收获。附上本人博客(https://blog.csdn.net/u011732358/article/details/84112507),里面记录了自己刷题的一些心得。
2018-12-17
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人