无论是做与微博相关研究还是开发相关应用,可能需要获取历史的或者实时的数据。如何获取呢?除了新浪微博为开发者提供了API, 还可以利用搜索功能(详见此文)来收集数据。
在历史数据获取方面,与twitter相比,搜索接口比较弱,好在提供了搜索功能。
在实时数据获取方面,sina 还是比较保守。与之相关的有三个接口用public_timeline、topics、nearby_timeline,分别用来收集公共的实时微博、某个话题下的实时微博、某点周围的实时微博。由此可以看出:缺乏在某地点关于某关键词的实时搜索接口。虽然有诸多限制,但仍然有代替方案是:利用搜索功能可以进行收集一个小时前微博的,同时可以对关键字和地点进行限制,等等。下面从历史和实时数据两个方面来讲述获取微博数据。
数据收