- 博客(0)
- 资源 (2)
- 问答 (9)
- 收藏
- 关注
BeautifulSoup
Beautiful Soup 是用 Python 写的一个 HTML/XML 的解析器,它可以很好的处理不规范标记并生成剖析树。通常用来分析爬虫抓取的web文档。
注意:为了解决乱码问题,用版本3的。如3.2.1。BeautifulSoup处理后的默认编码是utf-8。
中文文档:http://www.crummy.com/software/BeautifulSoup/bs3/documentation.zh.html
其他参考:http://www.cnblogs.com/viviancc/archive/2013/05/23/3094833.html
http://www.iteedu.com//plang/python/beautifulsoup/index.php
http://zhidao.baidu.com/link?url=c1lRnaJuVO3An2AYK4_aW9J-Zypfy05H_QAYLISK0c7sUsVlWS1VjSLeWkqsg5RmV8rrLJ7tkjjYFo8HHy6V0_
2013-10-12
在用rsync备份时出现错误
2022-03-16
systemd设置gvim开机自启动不成功
2021-09-11
jQuery如何获取获得焦点的当前元素而不是父元素?
2019-06-24
请帮忙写一个jQuery的代码
2019-06-22
请解释一下这个Linux命令
2018-09-21
npm安装web-ext总是失败
2018-06-12
vim用vundle时使用:PluginInstall出现错误
2017-04-12
Python3中的byte用decode后结果乱码
2016-10-24
如何用python实现获取操作网页的信息?
2013-10-12
TA创建的收藏夹 TA关注的收藏夹
TA关注的人