- 博客(2)
- 资源 (31)
- 收藏
- 关注
原创 3人团队,如何管理10万采集网站?(最全、最细解读)
人类的发展,经过了猿到人的发展。工业发展经历了石器时代、工业时代、智能工业的发展。 转存失败重新上传取消 采集也经历了从单点到多点,再到分布式的发展。采集源也从10个、100、1000个,再到1W、5万、10万的发展。那么这么多网站,我们怎么能保证它们一直有效(网站能够正常打开)呢? 时代在进步,公司在不断发展壮大,网站的内容也在不断的丰富,每年、每月都会有新的栏目上架,有旧栏目下架。我们又...
2020-03-22 23:43:12 501 1
原创 史上最快、最笨的公众号文章[阅读数、在看数]采集,哈哈
先前写过一篇《Python爬虫实践:如何快速、高效的爬取微信公众号阅读在看》的文章,里面介绍了四种公众号阅读数、在看数的采集方法,分别是: 第一种:使用第三方的平台获取 第二种方法:使用PC端模拟点击; 第三种:使用第三方工具; 第四种:基于微信公众号平台的方式; 今天抽空把第二种方式实现了,把代码贴出来供大家参考。其中分为两个类,一个是模拟点击等操作的公共类;一个是具体执行模拟...
2020-03-26 12:10:05 1664 1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人