python爬取简书首页前10文章

【投稿赢 iPhone 17】「我的第一个开源项目」故事征集:用代码换C位出道! 10w+人浏览 1.7k人参与

爬虫代码——爬取简书首页前10文章

from bs4 import BeautifulSoup 
from urllib.request import urlopen, Request 
 
 
# 配置 User-Agent 并创建 Request 对象 
headers = {'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64; rv:68.0) Gecko/20100101 Firefox/68.0'} 
req = Request(url='https://www.jianshu.com/', headers=headers) 
 
# 爬取网页 
bs = BeautifulSoup(urlopen(req).read(), 'html.parser') 
all_article = bs.find_all('a', {'class': 'title', 'target': '_blank'}) 
 
# 显示数据 
for article in all_article: 
    print('=====文章=====') 
    print('标题:{}'.format(article.get_text())) 
    print('链接: {}'.format('https://www.jianshu.com'+article.attrs['href'])) 
    print(article.parent.p.get_text()[7:])    # 每个描述字符串前都有 7 个空 格,需要截断 
    print('============\n') 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

裤裤兔

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值