
爬虫
丹枫无迹
这个作者很懒,什么都没留下…
展开
-
Python爬虫实例:爬取猫眼电影——破解字体反爬
字体反爬 字体反爬也就是自定义字体反爬,通过调用自定义的字体文件来渲染网页中的文字,而网页中的文字不再是文字,而是相应的字体编码,通过复制或者简单的采集是无法采集到编码后的文字内容的。 现在貌似不少网站都有采用这种反爬机制,我们通过猫眼的实际情况来解释一下。 下图的是猫眼网页上的显示: 检查元素看一下 这是什么鬼,关键信息全是乱码。 熟悉 CSS 的同学会知道,CSS 中有一个 @font-f...原创 2019-02-26 10:27:29 · 1765 阅读 · 0 评论 -
Python:黑板课爬虫闯关第五关
Python:黑板课爬虫闯关第五关 第五关是最后一关了,至此之后黑板课就没有更新过关卡了。 第五关地址:http://www.heibanke.com/lesson/crawler_ex04/ 可以看到,是在第三关的基础上加了验证码。 验证码识别我们可以通过 tesserocr 来识别,tesserocr 的使用在我的前面两篇博客中有介绍。 在这里,tesserocr 的识别率不是很...原创 2018-11-05 09:44:00 · 313 阅读 · 0 评论