书名:Python网络数据采集
作者:Ryan Mitchell
图书下载:https://pan.baidu.com/s/1sCbGimFnCxUiiZlz1Mynlw
图灵社区:http://www.ituring.com.cn/book/1709
目录:
第一部分 创建爬虫 | |
第 1 章 初见网络爬虫 | |
第 2 章 复杂 HTML 解析 | |
第 3 章 开始采集 | |
第 4 章 使用 API | |
第 5 章 存储数据 | |
第 6 章 读取文档 | |
第二部分 高级数据采集 | |
第 7 章 数据清洗 | |
第 8 章 自然语言处理 | |
第 9 章 穿越网页表单与登录窗口进行采集 | |
第 10 章 采集 JavaScript | |
第 11 章 图像识别与文字处理 | |
第 12 章 避开采集陷阱 | |
第 13 章 用爬虫测试网站 | |
第 14 章 远程采集 | |
附录 A Python 简介 | |
附录 B 互联网简介 | |
附录 C 网络数据采集的法律与道德约束 |