![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
论文数据挖掘与可视化分析
文章平均质量分 96
Renhai实验室
设计|数据分析与可视化 |智能家居
展开
-
数据挖掘利器 selenium实战案例--论文数据挖掘与可视化分析(下)
在上一篇文章说了用Python中的selenium包控制谷歌浏览器的方式,获取了城市规划领域2012年至2022年五种期刊的信息,清洗之后共8585篇论文文献,下篇说一下数据可视化。 一、发文量分析 1)各期刊发文占比,规划师期刊增刊多、发文量占优; 除了城市规划学刊是双月刊,其余期刊都为月刊,但规划师学刊近两年疯狂增刊,2021年发刊26期,可以改名为双周刊了。 规划师杂志增刊 a.1 发文量总览-期刊 2)教育机构是期刊论文的主要生产温床; 我们把发文机构分为四类,教育机构发表论文总量占比55.48%,原创 2022-12-29 18:54:10 · 273 阅读 · 0 评论 -
数据挖掘利器 selenium实战案例--论文数据挖掘与可视化分析(上)
最近为了对知网论文进行数据分析,需要获取包含标题、作者和作者单位(发文机构)、关键词、参考文献和引证文献等信息,于是用Python中的selenium包控制谷歌浏览器的方式,获取了城市规划领域2012年至2022年五种期刊论文的信息,清洗之后共8585篇论文文献。 本系列文章分为上下两篇,分别为数据挖掘和数据可视化分析,欢迎关注。 本文不包含selenium的详细安装和使用,需要的请查阅官方文档,或者其他人总结的文章。 一、数据挖掘 1 为什么选择又慢又占内存的selenium? 当然是因为知网网站的反扒措原创 2022-12-29 18:49:43 · 815 阅读 · 0 评论