知乎python练手的_Python—爬虫之初级实战项目：爬取知乎任一作者的文章练手

最新推荐文章于 2024-06-15 08:32:50 发布

weixin_39864738

最新推荐文章于 2024-06-15 08:32:50 发布

阅读量154

点赞数

文章标签：知乎python练手的

爬虫之初级实战项目：爬取知乎任一作者的文章练手

在正式上代码之前，先过一遍之前所学知识的框架内容，温故而知新！！！

接下来我们直接上代码，一定要手敲代码、手敲代码、手敲代码！！！

import requests,csv

csv_file = open('知乎-收录.csv','w',newline = '',encoding = 'utf-8')

#加newline=' '参数的原因是，可以避免csv文件出现两倍的行距(就是能避免表格的行与行之间出现空白行);

#加encoding='utf-8'，可以避免编码问题导致的报错或乱码。

writer = csv.writer(csv_file)

writer.writerow(['标题','摘要','链接'])

url ='https://www.zhihu.com/api/v4/members/zhang-jia-wei/included-articles?'

headers={'user-agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36'}

offset = 0

while True:

params = {

'include': 'data[*].comment_count,suggest_edit,is_normal,thumbnail_extra_info,thumbnail,can_comment,comment_permission,admin_closed_comment,content,voteup_count,created,updated,upvoted_followees,voting,review_info,is_labeled,label_info;data[*].author.badge[?(type=best_answerer)].topics',

'offset': str(offset),

'limit': '10',

'sort_by': 'included'

}

res = requests.get(url,headers = headers)

js_zh = res.json()

zhihu = js_zh['data']

for i in zhihu:

list1 = [i['title'],i['excerpt'],i['url']]

writer.writerow(list1)

offset = offset + 10 #利用offset对循环进行控制

if offset > 50:

break

csv_file.close()

标签：练手,comment,知乎,Python,代码,writer,offset,csv

weixin_39864738

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
知乎python练手的_Python—爬虫之初级实战项目：爬取知乎任一作者的文章练手

爬虫之初级实战项目：爬取知乎任一作者的文章练手在正式上代码之前，先过一遍之前所学知识的框架内容，温故而知新！！！接下来我们直接上代码，一定要手敲代码、手敲代码、手敲代码！！！import requests,csvcsv_file = open('知乎-收录.csv','w',newline = '',encoding = 'utf-8')#加newline=' '参数的原因是，可以避免csv文件出...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。