Python版本:3.6
IDE:PyCharm
1.解析HTML(这里以www.baidu.com为例)
headers = { 'Connection': 'Keep-Alive', 'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/60.0.3112.101 Safari/537.36' } soup = BeautifulSoup(requests.get("https://www.baidu.com/",headers=headers).content,'lxml')

本文介绍了使用Python 3.6和BeautifulSoup解析HTML,以www.baidu.com为例,讲解如何将解析后的数据写入文件。在过程中遇到的乱码问题,通过设置文件编码得以解决,最终成功将HTML内容写入文件。
最低0.47元/天 解锁文章
4842

被折叠的 条评论
为什么被折叠?



