爬取知乎高赞情话,甜蜜过七夕

又是一年一度的七夕情人节了!
有女朋友的就牵好手,有男朋友的就抱紧腿,什么都么得的小伙伴就带好装备,静静的吃狗粮就ok了。

在这里插入图片描述

在这个到处都冒着粉红泡泡的日子,不做点什么都不太好意思。
作为一名合格的代码搬砖工,经过慎重的思考,决定为小伙伴们的幸福贡献一份微薄之力。
特此爬取知乎上的高赞情话,让你在对女神/男神的约会中甜蜜暴击(咳咳咳,吃多了糖,有点齁)

1.搜索知乎高赞情话话题或评论

知乎搜索"情话",出现各种关于情话的话题贴,随便扫一眼都是心动的感觉啊喂。找一个高赞的,或者自己喜欢的点进入。
在这里插入图片描述

2.爬取高赞情话话题

在这里插入图片描述
“我的脑袋是个小小星球,每天只有你开着月亮列车巡游。”

有点意境,不错不错。就是你了。

单页面的话,结构简单,我们就选用requests,构建简单的爬虫结构。

在这里插入图片描述
第一步,创建一个知乎情话的对象。
初始化参数为起始页面链接和ua库。

第二步,创建发送请求的函数parse_url() ,参数为请求的链接url。
依据xpath获取网页内容的函数content_xpath(),参数为response响应对象和数据的xpath规则。

第三步,启动主函数

发送请求,获取响应。找到评论内容的xpath规则,调用content_xpath()函数,获取文本内容。

第四步,清洗数据,存入txt文本

代码如下:

def write_to_file(self, content):
    """
    数据写入文件
    :return:
    """
    file_path = os.path.dirname(os.path.abspath(__file__)) + "/七夕情话.txt"
    with open(file_path, "a", encoding='utf-8') as f:
        f.write(content+'\r\n')

知乎高赞的情话,已经尽归我手了。看下效果:
在这里插入图片描述
祝愿各位小伙伴今天可以躺到喜欢的人怀里。O(∩_∩)O哈哈~

想要源码的可以私我哟

“我本来是要行走江湖的,但是遇到你我觉得可以先停一停。”

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值