又是一年一度的七夕情人节了!
有女朋友的就牵好手,有男朋友的就抱紧腿,什么都么得的小伙伴就带好装备,静静的吃狗粮就ok了。
在这个到处都冒着粉红泡泡的日子,不做点什么都不太好意思。
作为一名合格的代码搬砖工,经过慎重的思考,决定为小伙伴们的幸福贡献一份微薄之力。
特此爬取知乎上的高赞情话,让你在对女神/男神的约会中甜蜜暴击(咳咳咳,吃多了糖,有点齁)
1.搜索知乎高赞情话话题或评论
知乎搜索"情话",出现各种关于情话的话题贴,随便扫一眼都是心动的感觉啊喂。找一个高赞的,或者自己喜欢的点进入。
2.爬取高赞情话话题
“我的脑袋是个小小星球,每天只有你开着月亮列车巡游。”
有点意境,不错不错。就是你了。
单页面的话,结构简单,我们就选用requests,构建简单的爬虫结构。
第一步,创建一个知乎情话的对象。
初始化参数为起始页面链接和ua库。
第二步,创建发送请求的函数parse_url() ,参数为请求的链接url。
依据xpath获取网页内容的函数content_xpath(),参数为response响应对象和数据的xpath规则。
第三步,启动主函数
发送请求,获取响应。找到评论内容的xpath规则,调用content_xpath()函数,获取文本内容。
第四步,清洗数据,存入txt文本
代码如下:
def write_to_file(self, content):
"""
数据写入文件
:return:
"""
file_path = os.path.dirname(os.path.abspath(__file__)) + "/七夕情话.txt"
with open(file_path, "a", encoding='utf-8') as f:
f.write(content+'\r\n')
知乎高赞的情话,已经尽归我手了。看下效果:
祝愿各位小伙伴今天可以躺到喜欢的人怀里。O(∩_∩)O哈哈~
想要源码的可以私我哟
“我本来是要行走江湖的,但是遇到你我觉得可以先停一停。”