本人pc上面装的是python35,在学习python网络爬虫的时候,需要用到Beautiful Soup库。该库可以将HTML解析为python对象,比如列表,字典等,这样就可以从网络上面获取内容,进行处理。
- 1.Beautiful Soup的下载地址是https://www.crummy.com/software/BeautifulSoup/bs4/download/,下载最新的版本。下载之后进行解压,放在某个路径下,我的放在D:\beautifulsoup4-4.6.0\beautifulsoup4-4.6.0
- 使用dos命令(在“运行”中输入cmd),切换到D:\beautifulsoup4-4.6.0\beautifulsoup4-4.6.0目录,然后执行
python setup.py install
按照以上步骤安装完后,进入python环境,导入BeautifulSoup,使用的命令是:from bs4 import BeautifulSoup
这个时候发现会报错:
‘You are trying to run the Python 2 version of Beautiful Soup under Python 3. This will not work.’<>’You need to convert the code, either by installing it (python setup.py install
) or by running 2to3 (2to3 -w bs4
).’
SyntaxError: invalid syntax
意思是python版本不对,BeautifulSoup默认是支持python2,在python3下面有异常。这个时候需要将BeautifulSoup转换为python3支持的版本。
将BeautifulSoup转换为python3支持的版本:
需要使用到python自带的转换工具,这个工具在C:\Programs\Python\Python35\Tools\scripts下面,名称是2to3.py。然后找到bs4文件夹的位置
执行版本转换的命令如下:python + 2to3.py+ bs4路径 + ‘-w’
转换完成后,重新进入python环境,再导入BeautifulSoup就可以了
BeautifulSoup4.4以上的才支持python3