爬虫那些事
zhaohuakai
这个作者很懒,什么都没留下…
展开
-
解决58同城使用font-face进行字符替换
最近在抓取58同城简历数据的时候,发现网页使用font-face进行字符替换。比如23岁,页面中编码是。也就是说,2的编码是0xe045,3的编码是0xe032。同时,对比多个网页,发现同一个字符,在页面中的编码不一样,如2在不同页面中的编码可能不断变化。这样替换有个好处,即使浏览器将页面渲染出来,显示出来的文字仍然是不可复制粘贴的,这是因为字符...原创 2018-07-25 01:12:48 · 25120 阅读 · 33 评论 -
爬虫抓了一本《延禧宫略》
最近女王迷上了《延禧宫略》,让我给她下一本,我搜了一下,网上有现成的嘛,这里就是一个:http://www.pingyaoji.com/yanxigonglue。正好最近在搞爬虫,便把每一章抓取下来,做了一个txt。下载在这里:https://download.csdn.net/download/zhaohuakai/10604236,或者百度云盘https://pan.baidu.com/s...原创 2018-08-15 00:31:08 · 2193 阅读 · 1 评论