微博爬虫之问题种种

最新推荐文章于 2024-08-09 08:06:10 发布

小豪学长啊

最新推荐文章于 2024-08-09 08:06:10 发布

阅读量2.6k

点赞数

分类专栏： python爬虫那些坑文章标签： python 爬虫微博 url IP

本文链接：https://blog.csdn.net/Alis_xt/article/details/60132965

版权

好不容易模拟登陆上了微博，想着可以好好执行我的爬虫之旅了，然而并没有，，，，，，一个微博账号以及一个IP地址不能爬太多信息，否则微博会当成机器人（事实也是机器人，哈哈），于是上万能的淘宝买了两个微博账号想着拿来轮换登陆爬信息，GG，在微博页面上是可以的登陆的，然而在代码上获取微博网页代码却不可以，想着应该是买的账号有问题，于是用了同事的小号，结果是可以的。但是这也只是解决账号问题，反爬好像是看IP地址的，所以得更换自己的IP，于是去大象代理买了几万个IP，轮奸微博。

    for num in range(1,6):
        
        url = 'http://s.weibo.com/user/' + xueyuan + '&page=' + str(num)
        #s = session.post(url)
        # 183.140.87.42:3128 可用
        #url = 'http://s.weibo.com/user/%25E9%2580%259A%25E4%25BF%25A1%25E5%25AD%25A6%25E9%2599%25A2&Refer=weibo_user'      
        #proxies = '183.140.87.42:3128'
        for ip in IP_list:
            try:
                ss = ses