list批量赋值_Python——十行批量爬取知乎用户信息

4fa537828dc27aa1cca23a8afbd98698.png

加油鸭接着上个内容,做了一点改进,可以批量爬取知乎用户信息。

实现思路:加一个id数组,循环访问获取id,然后输入到网址中,读取信息。

import requests
# 将浏览器复制出来的requests headers参数赋值给一个变量,一般直接用
headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.100 Safari/537.36",
    "Connection": "keep-alive",
    "Accept": "text/html,application/json,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8",
    "Accept-Language": "zh-CN,zh;q=0.8"}
# 你想要爬取的用户名列表
id_list = ['li-er-dan-12-76','yi-mei-cheng-xu-yuan-89','lao-bai-63-17','qi-e-chi-he-zhi-nan-66']
# 循环读取
for i in range(len(id_list)):
    user_id = id_list[i]
    # 爬取的API网址
    zhihu_api = f'https://www.zhihu.com/api/v4/members/{user_id}?include=follower_count,voteup_count,favorited_count,thanked_count'
    # 使用GET请求访问链接
    html = requests.get(zhihu_api, headers=headers)
    user = html.json()
    # 打印用户信息
    print(user)

打印效果:

{'id': 'abe6df5cd846083ae5953990e8c7a322', 'url_token': 'li-er-dan-12-76', 'name': '李二蛋', 'use_default_avatar': False, 'avatar_url': 'https://pic1.zhimg.com/v2-a9b25b49fb9630b23d13c995b1745af8_l.jpg', 'avatar_url_template': 'https://pic3.zhimg.com/v2-a9b25b49fb9630b23d13c995b1745af8.jpg', 'is_org': False, 'type': 'people', 'url': 'https://www.zhihu.com/api/v4/people/li-er-dan-12-76', 'user_type': 'people', 'headline': '物理文学游击队', 'gender': 1, 'is_advertiser': False, 'vip_info': {'is_vip': False, 'rename_days': '60'}, 'follower_count': 361, 'favorited_count': 794, 'voteup_count': 1601, 'thanked_count': 288, 'is_realname': True}
{'id': '347ab6168e550343cc7f6a531685f08b', 'url_token': 'yi-mei-cheng-xu-yuan-89', 'name': '一枚程序媛', 'use_default_avatar': False, 'avatar_url': 'https://pic3.zhimg.com/v2-c61445caf002560ff50aeb30c29457db_l.jpg', 'avatar_url_template': 'https://pic4.zhimg.com/v2-c61445caf002560ff50aeb30c29457db.jpg', 'is_org': False, 'type': 'people', 'url': 'https://www.zhihu.com/api/v4/people/yi-mei-cheng-xu-yuan-89', 'user_type': 'people', 'headline': '程序媛', 'gender': -1, 'is_advertiser': False, 'vip_info': {'is_vip': False, 'rename_days': '60'}, 'follower_count': 1337, 'favorited_count': 15815, 'voteup_count': 3358, 'thanked_count': 396, 'is_realname': True}
{'id': 'eba2d91c1c10568322d8fc6f370deb99', 'url_token': 'lao-bai-63-17', 'name': '老白', 'use_default_avatar': True, 'avatar_url': 'https://pic1.zhimg.com/da8e974dc_l.jpg', 'avatar_url_template': 'https://pic3.zhimg.com/da8e974dc.jpg', 'is_org': False, 'type': 'people', 'url': 'https://www.zhihu.com/api/v4/people/lao-bai-63-17', 'user_type': 'people', 'headline': '', 'gender': -1, 'is_advertiser': False, 'vip_info': {'is_vip': False, 'rename_days': '60'}, 'follower_count': 6, 'favorited_count': 3, 'voteup_count': 46, 'thanked_count': 9, 'is_realname': True}
{'id': '5fc6efdea7fb5b7f6bbd233a55880973', 'url_token': 'qi-e-chi-he-zhi-nan-66', 'name': '企鹅吃喝指南', 'use_default_avatar': False, 'avatar_url': 'https://pic4.zhimg.com/v2-d97d304d4e800b4b058b5080eeda0aeb_l.jpg', 'avatar_url_template': 'https://pic1.zhimg.com/v2-d97d304d4e800b4b058b5080eeda0aeb.jpg', 'is_org': True, 'type': 'people', 'url': 'https://www.zhihu.com/api/v4/people/qi-e-chi-he-zhi-nan-66', 'user_type': 'organization', 'headline': '你身边最懂吃喝的好朋友', 'gender': -1, 'is_advertiser': False, 'vip_info': {'is_vip': False, 'rename_days': '60'}, 'follower_count': 140891, 'favorited_count': 975265, 'voteup_count': 415792, 'thanked_count': 143847, 'is_realname': True}

想要爬取更多用户的信息,直接在id_list中添加即可。

加油鸭,之后继续改进代码~

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值