在引用beautifulsoup解析html时,大多数都会 soup = BeautifulSoup(html, ‘lxml’)像这样使用,但是值得注意一点的是,在使用这个库的时候最好引入lxml库,若不引入会出现解析不了html文本的情况。
lxml不管是使用国内镜像还是其他大概率直接pip install lxml是不会成功的。
可以到https://pypi.org/project/lxml/#files下载适合自己的lxml.wheel文件,然后将其放到自己项目文件夹下,再pip install lxml。
Python爬虫使用beautifulsoup4的一些小建议
最新推荐文章于 2022-03-05 16:24:29 发布