爬取知乎高赞情话,甜蜜过七夕

又是一年一度的七夕情人节了!
有女朋友的就牵好手,有男朋友的就抱紧腿,什么都么得的小伙伴就带好装备,静静的吃狗粮就ok了。

在这里插入图片描述

在这个到处都冒着粉红泡泡的日子,不做点什么都不太好意思。
作为一名合格的代码搬砖工,经过慎重的思考,决定为小伙伴们的幸福贡献一份微薄之力。
特此爬取知乎上的高赞情话,让你在对女神/男神的约会中甜蜜暴击(咳咳咳,吃多了糖,有点齁)

1.搜索知乎高赞情话话题或评论

知乎搜索"情话",出现各种关于情话的话题贴,随便扫一眼都是心动的感觉啊喂。找一个高赞的,或者自己喜欢的点进入。
在这里插入图片描述

2.爬取高赞情话话题

在这里插入图片描述
“我的脑袋是个小小星球,每天只有你开着月亮列车巡游。”

有点意境,不错不错。就是你了。

单页面的话,结构简单,我们就选用requests,构建简单的爬虫结构。

在这里插入图片描述
第一步,创建一个知乎情话的对象。
初始化参数为起始页面链接和ua库。

第二步,创建发送请求的函数parse_url() ,参数为请求的链接url。
依据xpath获取网页内容的函数content_xpath(),参数为response响应对象和数据的xpath规则。

第三步,启动主函数

发送请求,获取响应。找到评论内容的xpath规则,调用content_xpath()函数,获取文本内容。

第四步,清洗数据,存入txt文本

代码如下:

def write_to_file(self, content):
    """
    数据写入文件
    :return:
    """
    file_path = os.path.dirname(os.path.abspath(__file__)) + "/七夕情话.txt"
    with open(file_path, "a", encoding='utf-8') as f:
        f.write(content+'\r\n')

知乎高赞的情话,已经尽归我手了。看下效果:
在这里插入图片描述
祝愿各位小伙伴今天可以躺到喜欢的人怀里。O(∩_∩)O哈哈~

想要源码的可以私我哟

“我本来是要行走江湖的,但是遇到你我觉得可以先停一停。”

发布了43 篇原创文章 · 获赞 43 · 访问量 9万+
展开阅读全文

没有更多推荐了,返回首页

©️2019 CSDN 皮肤主题: 大白 设计师: CSDN官方博客

分享到微信朋友圈

×

扫一扫,手机浏览