- 博客(3)
- 收藏
- 关注
原创 豆瓣最受欢迎的影评内容爬取
Python语言【RE正则表达式,Xpath语法的应用】-豆瓣最受欢迎的影评----1~5页,电影名、作者名、评论时间、推荐级别、评论内容(全文)
2023-12-09 21:12:33 601 4
原创 Windows下Spark开发环境的搭建
Spark是一个快速、通用、可扩展的大数据处理引擎,最初由加州大学伯克利分校的AMPLab开发。Spark提供了一种基于内存的分布式计算模型,能够在大规模数据集上进行高效的数据处理、机器学习和图形计算等任务。Spark支持多种编程语言,包括Java、Scala、Python和R等,同时也提供了丰富的API和工具,如Spark SQL、Spark Streaming、MLlib和GraphX等,方便开发人员进行数据处理和分析。Spark的优势。
2023-12-14 23:18:33 1853 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人