根据新浪微博的mid(url)获得微博id

新浪的每一条微博、评论、私信都有id,同时也有一个url。

以微博为例,每条微博都有一个url,例如http://weibo.com/1594536477/z9Ad7z6AG

其最后的z9Ad7z6AG就是该微博的url,这个url和微博的id有一个加密对应,就是10进制和62进制之间的转换。

转换规则是,url串值从最后往前,每四个字符为一组,作为一个62进制数,然后将各个62进制数转换成对应的10进制数,再将最终结果连接起来,就是该微博的id。


代码如下:

#62 to 10 dict
ALPHABET = "0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ"
DICT = {}

def get_dict():
	for index in range(len(ALPHABET)):
		DICT[ALPHABET[index]] = index

#62 to 10
def key62_to_key10(str_62):
	value = 0;
	for s in str_62:
		value = value * 62 + DICT[s]
	return value

#transfrom msg_url to msg_id
def murl_to_mid(murl):
	length = len(murl)
	mid = ''
	group = int(length/4)	#four characters per group
	last_count = length % 4	#head group character counts 
	
	for loop in range(group):
		value = key62_to_key10(murl[length-(loop+1)*4:length-loop*4])
		mid = str(value) + mid
	if last_count:
		value = key62_to_key10(murl[:length-group*4])
		mid = str(value) + mid
    return mid


先执行get_dict(),再执行murl_to_mid,就得到了对应的微博id。

给一个测试数据:

url : xvptc5eRe

mid: 3374860781248756

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值