一、什么是beautifulsoup4
Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.Beautiful Soup会帮你节省数小时甚至数天的工作时间.Beautiful Soup是个小模块,用来解析和检查经常在网上看到的那类乱七八糟而且不规范的HTML。
详细内容请点击下方链接查看:
https://www.crummy.com/software/BeautifulSoup/bs4/doc/index.zh.html
欢迎可以关注好男人的微信公众号:菜鸟资源分享,完全免费的资源分享平台,互相学习,共同进步
二、如何安装beautifulsoup4
1、安装环境:Windows + Python2.7 + beautifulsoup4
2下载beautifulsoup4-4.5.1.tar.gz,(版本大家自己选择)
下载链接:https://www.crummy.com/software/BeautifulSoup/bs4/download/
3、下载后将其剪切到python2.7的安装路径,并解压;
4、在CMD命令创接口进入该文件夹,并执行命令setup.py install:
5、将解压出来文件夹里的bs4拷贝到python2.7的Lib文件夹里面;
6、并将python2.7安装目录下的:Tools——>Script,文件夹里的2to3.py拷贝到ptrhon2.7的Lib文件夹里面
7、现在就已经成功的安装好了beautifulsoup4;
8、注意:在以前的Python书中直接使用:
from BeautifulSoup import BeautifulSoup
导入这个模块,但是beautifulsoup升级到4以后这种写法是错误的应该写成:
import bs4
from bs4 import BeautifulSoup
大家可以关注我哦,我也是个刚刚学习Python的小白,我所遇到的问题会第一时间找到答案并在此分享哦。
也欢迎大家关注我的免费资源分享平台:微信公众号“菜鸟资源分享”一个完全免费的软件以及资源分享平台。