参考:http://blog.csdn.net/onetoneom/article/details/8181205
本来自己用htmlunitxjava写了一个微博爬虫的,模拟登陆部分教程在这里:http://www.cnblogs.com/DeeFOX/p/3530291.html(后来懒得写完整个爬虫教程就废置了,因为也没什么技术含量,就是按标签来抓),自己写有自己写的好处,就是不受api限制,想爬什么爬什么——天真==|,后来发现新浪微博很小气,不让爬,爬多了封号,好!老子多注册几个号,但更绝的来了,微博改版了!移动端不好好做,浪费这些人力物力去改版,但是,他改版了我还是要抓取内容啊!!!为了不再浪费时间,屈服使用它提供的开放平台api去抓取
—————— 我是吐槽分界线 ————————
预备工作:
1、到这里注册一个开发者账号:http://open.weibo.com/
2、申请一个站内应用:http://open.weibo.com/development/canvas
从而获得:App Key 和 App Secret
并注意填写:站内应用地址(随便填)和 应用实际地址(只要填一个本机可以访问到的地址,为了拿到后面开发要用的一个key:楼主填了www.baidu.com)
3、上述这些都不需要审批通过,填完了马上用!
获得开发包:
1、到这里下载JavaSDK:http://code.google.com/p/weibo4j/
2、解压,用eclipse import项目,后来发现项目(Weibo4j-oauth2.0-beta2.1.1)使用的是JDK6,有些包JDK7已经改名的,大家要注意了,可以下载JDK6并将project build path的JSL改成JRE6
使用:
1、填写weibo4j目录下的配置文件config.properties:
client_ID = (App Key)
client_SERCRET = (App Secret)
redirect_URI = (应用实际地址)
2、运行example.oauth2.OAuth4Code.java文件的main函数获取access token:
(发现那个code用java不能直接抓取,很纠结)
输入账号和密码,然后系统回调发给你一个code(一个百度的地址后面加个code==#,我说怎么不能抓包分析,https啊)
将code copy下来到控制台[Enter]:后面,然后回车!
得到返回的access token,那么就是这个acess token了
3、利用AT,通过Statuses/public timeline获得最新微博: