爬虫
Kungs8
这个作者很懒,什么都没留下…
展开
-
RedisCrawlSpider爬虫遇到 `明威把`不能转换为汉字的解决办法
问题阐述爬取网页时,正常情况下python3中能直接转化为utf-8,即所谓的汉字能够正常显示。所以即使网页中显示的是这种escape sequence,获取到之后能够显示正常,但是偶尔也不好使,不好使的情况下就会出现以下的charref状态:明威把解决方法In [1]: from html.parser import HT...原创 2018-10-22 21:34:55 · 476 阅读 · 0 评论 -
python爬取网页的视频
这里指定了一个视频的链接地址:http://f.us.sinaimg.cn/000bIRNylx07uBalSO1y0104120cNh4r0E050.mp4?label=mp4_hd&template=640x360.28.0&Expires=1561614590&ssig=KYl0nz%2BLey&KID=unistore,video# -*- codin...原创 2019-06-27 13:26:49 · 11769 阅读 · 2 评论