橡皮擦,一个逗趣的互联网高级网虫。
文章的起源
周末,一个群友用 1 个小时,完成一个小需求,赚了 ¥None 元。
他说:距离财富自由又近了一步,并且一度在群里不断炫富。
然后我把它的代码给公开了,估计他要失去这条财富之路了。
阅读本文你将收获
lxml
库解析知识;- 粗糙的反
反爬
技术; XPath
语法再度了解;- 20000+漫展历史数据。
采集 20000+漫展历史数据
目标数据分析
本次要抓取的目标为:https://www.nyato.com/manzhan/?type=expired&p=1,具体数据区域如下所示。如需要更多数据,可以在此基础上,进一步进行扩展。