爬虫实践参考整理

爬虫实践参考整理

1、笔趣网
PS:里面对于文本的处理以及超出范围的问题,需结合评论区改进
2、知乎
PS:不用模拟登陆,利用搜狗搜索进入知乎,获取开发者信息,对于自己想要找的问答,替换url及相关属性即可,不过爬起来不是很稳定
3、微博
PS:未实践,涉及分布式存储,模拟登陆等

本文目前只是笔者学习别人写的爬虫过程中的记录,故其中链接目前均为转载
分别放置如下:
原文链接 1:https://blog.csdn.net/c406495762/article/details/71158264
原文链接2:https://blog.csdn.net/wenxuhonghe/article/details/86515558
原文链接3:https://github.com/SpiderClub/weibospider/wiki

【未完】

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值