获取百度新闻标题(爬虫新人)

import requests

导入请求模块,requests算是爬虫中比较好用的几个模块。
可以在命令指示符(cmd)中用 pip install requests 来安装requests模块。

from bs4 import BeautifulSoup

从bs4中导入BeautifulSoup库。
如果出现错误,可能是未安装bs4,
安装bs4,在命令指示符中输入 pip install bs4 然后回车,来安装bs4模块
还有在pycharm中安装bs4
打开pycharm--file--settings--progect interprete--点击+号--然后搜索bs4就可以。

response=requests.get('http://news.baidu.com')

对百度新闻网页发送网络请求。

soup=BeautifulSoup(response.text,features="lxml")

打印文件,并用lxml解析器进行解析。
如果没有lxml解析器,可以在cmd中下载
pip install lxml 使用此代码可以下载。

print(soup.find('title').text)

输出标题title(标题).text以文本形式输出。

最后输出的结果是

而百度新闻的标题是

 我们在刚开始学习爬虫时,会有许多的模块,库不知道该如何下载和要下载什么,对此,小编在这里告诉各位,先从简单的代码开始写,在你写的时候,你的代码可能会出现许多的错误,其中,肯定有因为未下载模块而报错,但是,当你一路走过后,你会发现,该下载的模块在解决错误时都下载好了。

 

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值