Python-爬虫初体验

本文记录了作者通过观看网易云课堂教学视频学习Python爬虫的过程。以新浪新闻网站为实践对象,使用BeautifulSoup库进行网页解析,抓取新闻标题、时间和链接。目前完成初步抓取,后续将学习更多爬虫知识并更新内容。此外,分享了一个知乎上的50行Python爬虫代码,用于爬取知乎页面,并提供了优化后的代码片段。
摘要由CSDN通过智能技术生成

在网易云课堂上看的教学视频,现在来巩固一下知识:

  1. 先确定自己要爬的网站,以新浪新闻网站为例确 这里写图片描述
import requests  #跟java的导包差不多,python叫导入库
res = requests.get('http://news.sina.com.cn/china/')#爬取网页内容
res.encoding = 'utf-8' #将得到的网页内容转码,避免乱码
print(res.text) #将网页内容以text形式输出

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值