1、xpath重点
2、lxml使用注意点
3、爬取文本后储存到txt中
4、将Xpath中文本存到JSON文件中
5、在单引号或者双引号里引入变量使用
6、在xpath中的引号里面引入变量,首先将索引转换为字符串,然后在你需要添加的地方输入{},最后在引入format语句
7、如果想使用xpath提取包含em的所以文字(记住://text())
8、如果爬虫时候遇到url有时候是href,有的时候是href_to,你需要设置一个if-else语句。
6、在xpath中的引号里面引入变量,首先将索引转换为字符串,然后在你需要添加的地方输入{},最后在引入format语句