Python + Tweepy 实现Twitter信息抓取(1)——准备阶段

  • 账号准备
  • 环境准备
  • 测试

账号准备

  1. 首先需要在twitter官方注册twitter账号,并新建一个应用,链接:新建应用
  2. 如果新建应用不成功,国内大多数情况都是无法验证手机号,可以参考这个教程,亲测有效,链接:验证手机号
  3. 注册成功后,可以查看自己的keys and access token,如下图:
    注册成功后界面

环境准备

  1. 安装python
  2. 安装pip:
    进入命令行,把目录切换到python的安装目录下的Script文件夹下,运行 easy_inatall pip
  3. 安装tweepy:
    在命令行中输入:pip install tweepy

测试

测试代码如下:

#  -*- coding: utf-8 -*-
import tweepy
from tweepy import OAuthHandler

consumer_key = 'replace your own account consumer_key'
consumer_secret = 'replace your own account consumer_secret'
access_token = 'replace your own account access_token'
access_secret = 'replace your own account access_secret'

auth = OAuthHandler(consumer_key,consumer_secret)
auth.set_access_token(access_token,access_secret)

api = tweepy.API(auth)

for status in tweepy.Cursor(api.home_timeline).items(2):
    print (status.text)

但是这样可能会报错,报错信息如下:

tweepy.error.TweepError: Failed to send request: HTTPSConnectionPool(host='api.twitter.com', port=443): Max retries exceeded with url: /1.1/statuses/home_timeline.json (Caused by ProxyError('Cannot connect to proxy.', NewConnectionError('<requests.packages.urllib3.connection.VerifiedHTTPSConnection object at 0x0000000002FC6E80>: Failed to establish a new connection: [Errno 10061] ',)))

主要原因就是twitter被墙了,twitter的api当然也被墙了。
这时候就需要挂代理翻墙了,我使用的是自己搭建的shadowsockets。其它翻墙软件或者服务器网上有很多,请自行查找。
代理打开了之后,在原代码中,将

api = tweepy.API(auth)

改为

api = tweepy.API(auth,proxy="127.0.0.1:1080")

测试结果:成功获取了两条内容
成功

  • 5
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 5
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值