- 博客(2)
- 收藏
- 关注
原创 写一个简单的贴吧热搜爬虫
这样看起来就好多了,不过这是这一天的内容,要是能收集一年的热搜内容,我觉得关键词一定的“如何”“评价”抗压背锅那群比是真的tm能水。第一步先用python的selenium去读取热搜(selenium并不是一个很好的爬虫选择,效率很低,但是简单好用)设计的时候忘了,给内容添加一个唯一的约束吧。在数据库里我们就可以做其他的操作了,比如用jieba断句,看看有那些关键词,好吧有点乱。然后创建一个数据库,就简简单单三列就可以,id,内容,日期。把要输入的数据做一些调整,日期要当天的,内容改为要输入的。
2023-11-16 11:23:59 718 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人