阳光热线问政平台爬取数据分析学习,词云分析(详细版)
html/body/div[2]/div[3]/ul[2]/li//span[@class=‘state1’]/text()这样提取里面的内容。我们继续操作不难发现li标签可以提取到一行数据,并且第二行是li[2],第三行是li[3],按照这种思路我们可以把他们作为一组来提取。提取的思路就是按照里面的语法,我们来看看html元素。我们选中里面表格的元素进行点击检查,这个就实现一个页面我们如何提取数据。然后我们来处理开发下一页的逻辑。复制后我们点击下载好的插件。我们再进行词云分析学习。
原创
2024-06-03 15:58:26 ·
351 阅读 ·
0 评论