Python 通过知乎热榜api端口抓取数据

Python 通过知乎热榜api端口爬取数据

前几天写了份知乎网页版爬取热榜信息的帖子,思来想去,过于繁琐,于是采用抓取知乎热榜api端口的方式进行解析,果不其然,心情舒畅了。

控制台打印输出时,会有一项关于SSL证书的警告,无需理会,如下:


InsecureRequestWarning: Unverified HTTPS request is being made to host 'api.zhihu.com'. Adding certificate verification is strongly advised. See: https://urllib3.readthedocs.io/en/latest/advanced-usage.html#ssl-warnings
  warnings.warn
  

项目代码如下,至于如何抓取api端口,各位大佬可自行百度,也是比较简单。

import requests
import json

# 构建请求头
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.82 Safari/537.36',}

# 知乎热榜api网址
url = 'https://api.zhihu.com/topstory/hot-list?limit=10&reverse_order=0'

# 发送请求 并返回数据
resp = requests.get(url = url, headers = headers, verify=False)

# 提取数据
for i in range(0, 50):
    hot = resp.json()['data'][i]['detail_text']  # 热度值
    title = resp.json()['data'][i]['target']['title']  # 标题
    link_url = resp.json()['data'][i]['target']['url']  # 链接地址
    # 转化为网页版的网址进行查看
    link_url = str(link_url).replace('api', 'www').replace('questions', 'question')
    excerpt = resp.json()['data'][i]['target']['excerpt']  # 简述信息
    print('{} {} {} \n{}\n\n'.format(hot, title, link_url, excerpt))  # 格式化输出 
 
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
【资源说明】 基于对知乎热榜话题的数据抓取、分析与可视化python源码+数据集.tar基于对知乎热榜话题的数据抓取、分析与可视化python源码+数据集.tar基于对知乎热榜话题的数据抓取、分析与可视化python源码+数据集.tar基于对知乎热榜话题的数据抓取、分析与可视化python源码+数据集.tar基于对知乎热榜话题的数据抓取、分析与可视化python源码+数据集.tar基于对知乎热榜话题的数据抓取、分析与可视化python源码+数据集.tar基于对知乎热榜话题的数据抓取、分析与可视化python源码+数据集.tar基于对知乎热榜话题的数据抓取、分析与可视化python源码+数据集.tar 基于对知乎热榜话题的数据抓取、分析与可视化python源码+数据集.tar基于对知乎热榜话题的数据抓取、分析与可视化python源码+数据集.tar 基于对知乎热榜话题的数据抓取、分析与可视化python源码+数据集.tar 【备注】 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用!有问题请及时沟通交流。 2、适用人群:计算机相关专业(如计科、信息安全、数据科学与大数据技术、人工智能、通信、物联网、自动化、电子信息等)在校学生、专业老师或者企业员工下载使用。 3、用途:项目具有较高的学习借鉴价值,也适用于小白学习入门进阶。当然也可作为毕设项目、课程设计、大作业、初期项目立项演示等。 4、如果基础还行,或者热爱钻研,亦可在此项目代码基础上进行修改添加,实现其他不同功能。 欢迎下载,沟通交流,互相学习,共同进步!

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值