爬虫
Read__Book
这个作者很懒,什么都没留下…
展开
-
window7下安装Scarpy
1.安装Python 不多说,记得配置环境变量2.安装lxml lxml是一种使用 Python 编写的库,可以迅速、灵活地处理 XML。 cmd窗口下运行:python -m pip install lxml3.安装setuptools 一般都已经安装了的,可在cmd中用 python -m pip list 查看是否已经安装,如果没安装原创 2017-06-24 13:35:39 · 682 阅读 · 0 评论 -
使用selenium调用火狐浏览器爬取网页文本及链接
时间:2017年8月6号晚上3点40分 , 失眠了,闲来无事写个随笔吧。几天前朋友问我能不能帮他爬取一个网址的文本及链接,想自己整理一便以方便学习,网址:http://www.bianceng.cn/Programming/cplus/需求:将网页内的文本内容及对应超链接保存到本地,总共60页,1773条考虑到网页中第一页的url为:http://www.bianceng原创 2017-08-06 03:36:17 · 5163 阅读 · 0 评论