前言:由于微博网页采用动态加载方式,只能获取到js脚本,不能使用beautifulsoup解析,需要使用正则匹配获取信息
1.获取用户热门帖子转发地址
如下Kb4cwauSp为转发地址的关键参数
使用正则进行匹配
add = urllib.request.Request(url="https://weibo.com/u/%s?is_hot=1" % o_id, headers=headers)
r = urllib.request.urlopen(url=add, timeout=10).read().decode('utf-8')
repost_links = re.findall(r'<a action-data=\\"allowForward=1&url=https:\\/\\/weibo.com\\/%s\\/(.*?)&mid=(\d+)&' % o_id, r)
如下为参数的使用方式
2.获取转发地址下转发用户ID
通过分析ajax数据,可知转发列表通过ajax传输数据