第1章 Python与网络爬虫1
% I x& q3 D/ p/ w1 k0 Z. S1.1 Python语言1
% `6 |* M2 l. f0 N4 Z: [0 {, P( Y1.1.1 什么是Python1* s; f7 ]8 y$ Q& s/ P* T
1.1.2 Python的应用现状2; i. d# ]8 s8 \8 i |" h4 ~, h
1.2 Python的安装与开发环境配置3
. N8 S, u2 I4 h1.2.1 在Windows上安装32 `! i$ v4 Y, t) s/ O! D) `
1.2.2 在Ubuntu和Mac OS上安装4
# n! v5 `4 I* s( q4 }/ D) @1.2.3 PyCharm的使用5- _# d( E6 B/ c( {9 j1 @( d
1.2.4 Jupyter Notebook96 b* g5 V$ b$ D, \. w1 Q7 o
1.3 Python基本语法12
( Z+ l: m6 l- C: `3 J" g. J1.3.1 HelloWorld与数据类型12" T5 ?" X, P; M' N: R, [
1.3.2 逻辑语句19
u9 B% w) L- u& F: @1.3.3 Python中的函数与类22
0 Z' ]4 r/ q' Q% j/ f1 Z+ f! ^1.3.4 Python从0到1254 N6 D5 D9 O4 s! S: @' I) `7 M4 ~
1.4 互联网、HTTP与HTML25
; b6 E3 h# `- n; r. A H. m1.4.1 互联网与HTTP25
- b$ G3 C" ^9 ^ j; F) S( n |; U1.4.2 HTML277 H6 G p P. F* P `; i
1.5 Hello, Spider!29
) E. Z0 D, t2 ~8 ?& @8 A7 y1.5.1 第一个爬虫程序295 L& X O6 l, A9 {. |6 E
1.5.2 对爬虫的思考31# C: R/ d# o3 L* M- ?8 q) B
1.6 调研网站33* o& s4 E: o6 w. ^, v& F6 {1 W- I
1.6.1 网站的robots.txt与Sitemap33
; F3 \/ `% e7 y. l- T1.6.2 查看网站所用技术36- Z) @) @4 s1 b; J7 ~! t
1.6.3 查看网站所有者信息37
8 F6 P6 j: u2 G: m( K. |; f& |1.6.4 使用开发者工具检查网页391 @5 @ F8 e9 n M6 V$ S9 D
1.7 本章小结42% ?4 P$ w3 i7 ]* e: I
5 x) n. i) o0 Y第2章 数据采集43
/ y- v, t$ P- V# r/ E8 R2.1 从抓取开始43& w3 A! \5 q0 o$ V7 T
2.2 正则表达式448 K$ f' y- z- c& w& |8 w/ Z- M$ @; P/ `, _
2.2.1 初见正则表达式447 e x8 n" j6 N) b9 W2 k+ @: r! S- H! _
2.2.2 正则表达式的简单使用46
]