- 博客(1)
- 资源 (3)
- 收藏
- 关注
原创 记一次Spark SQL的优化
本位分析了线上Spark SQL任务执行慢的原因,并介绍了Distribute By、Cluster By、Broadcast等优化方法的原理与使用方式。
2019-07-13 00:50:22 4547
riso-jay.zip
亲测可用java编写基于selenium的方式抓取豆瓣读书书籍内容
可以爬取豆瓣读书的丛书和推荐二个入口的书藉详情并生成excel文件(含封面)
在/riso-parent/riso-web-crawler/jar 文件夹有打好包的jar及批处理(只要jdk是1.8以上就可以直接运行)
附
2020-06-19
场景模拟代码.zip
间隙锁文章对应场景模拟代码,支持配置并发数以及随机项。第一次运行程序会较高概率出现死锁,若不修改menu_id范围重复执行,将不会触发死锁情况,读者可以自行思考原因。
2019-12-23
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人