python爬虫方向的第三方库_python网络爬虫(四)python第三方库BeautifulSoup4的安装及测试...

一、安装

1.以管理员身份启动cmd

1941191-20200215162722074-1322201640.png

2.输入口令:python -m pip install beautifulsoup4 敲回车 我在这给大家提个醒,配置环境真的很费时间,中间会出现各种问题,一定不要心急,

心急吃不了热豆腐呀~但是python库安装我认为遇到的问题都是一样的,就是超时,我是一直不断地让它安装,反反复复7/8次,不着急,超时就让它超时,

能安装一点是一点,到最后肯定能安装好~ 给大家上图我不断超时、最后终于成功的截图!

1941191-20200215173709207-224922686.png

1941191-20200215173802821-463862360.png

3.在安装成功后,大家可以测试一下是否安装成功。

演示HTML页面地址:http://python123.io/ws/demo.html

1941191-20200215174319754-279163266.png

可以单击右键鼠标选择查看网页源代码,看不懂不要紧哦,就理解程成是许许多多的标签,构成了页面,一个排版规则

1941191-20200215174545384-1508537294.png

原理就是:我们先用requests库get()方法爬取网页所有内容,然后定义demo为整个文本内容,然后让beautifulsoup(类)来熬制这个汤熬成

它能理解的HTML5。注意哦,我们虽然导入的是beautifulsoup4库,但是我们在写的时候写成了缩写bs4,并且只用一个BeautifulSoup类,

注意B、S是大写

1 importrequests2 r = requests.get("https://python123.io/ws/demo.html")3 demo =r.text4 from bs4 importBeautifulSoup5 soup = BeautifulSoup(demo,"html.parser") #熬制html类型的解释的汤6 print(soup.prettify)

1941191-20200215175856179-1197084260.png

这就是今天的第三方库的安装和检测的学习,是不是历程艰辛但是也是很有趣呢~贵在坚持啦😀😀😀😀😀😀

--------------------------下一期将带来BeautifulSoup4的简单学习!!加油,贵在坚持!------------------------------------------

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值