昨天,我发布了微博寻人二代系统-微博寻人链

       昨晚在新浪博客发了个博文,分享了些开发思考:http://blog.sina.com.cn/s/blog_593af2a701017jxn.html

       这里就技术性问题,做一个分享,谈谈开发过程中最困难的问题。

       微博寻人链,简单来说,就是你有一个话题,你想知道,什么人是讨论这个话题,最积极的人。你如“小米”,这个概念,谁是最爱讨论的人。就解决这个问题。

       第一版索引上去以后,效果很不好,原因是很多小号(营销账号),虽然大量转发和讨论,但是不客观,不权威,因此按照讨论数排序,是不合理的。

       第二版索引追加了粉丝数,如果两个人粉丝数多,说明有价值,这样也会出现一个问题,前排基本被李开复,薛蛮子,雷军等大号垄断,即便这个话题并不是和他们有关,例如一些专业学科类问题。

       第三版索引追加了领域权威性,这样效果才可接受了。但因为要想出现一个<人,人,关键词>的三元组,而且是在微博这么关键词很少,文章很短的情况下,所以三元组出现的概率极低。因此如果需要效果,就需要大量数据,未来还需要持续扩充。

       如果朋友们对社交挖掘感兴趣,可以参加我组织的西瓜大会,在线下进行充分的交流,我们的网址 http://xiguadahui.com 欢迎惠存,每个月都会举办一次,已经举办三次,大多讨论的是社交挖掘的技术和应用,欢迎你们来和我讨论。 下次计划在10月24日。

   

       

   

   

     

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值