微博用户相似度分析

微博的几个操作:原创、转发、回复、阅读、关注、@。其中,前四个是针对短博文;关注和@则针对的是用户之间的关系,关注某个人就意味着你成为他的粉丝,而他成为你的好友;@某个人意味着你想要他看到你的微博信息。


1)标签传播算法

只针对用户标签:

    a)对每一个用户,根据其初始标签生成标签向量X={x1,x2,...xn}。

    b)对每一个用户,令Y = X1 ∩ X2 ...∩ Xm = {y1,y2,...,yk},表示其好友和粉丝的标签向量的交集;对Y的每一个分量yi,统计yi在X1 ∪ X2 ...∪ Xm中出现的频率。

    c)选择向量Y中频率最高的K个标签分量作为该用户的K个标签。

    d)重复b、c直到每个用户的标签变化不大。

2)关键词拟合算法

只针对用户微博:

    a)对每一个用户,根据其微博内容分词,生成关键词向量X={x1,x2,...xn}。

    b)对该用户的每个好友和粉丝Xi,用 | X ∩ Xi | 除以 | X ∪ Xi | 表示Xi与X的微博相似程度。

    c)根据该相似度对标签传播进行加权。

3)时间差分拟合算法

考虑时间因素造成用户兴趣的变化:

    aÿ

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值