URL关联性分析及推荐算法
1. 首先将第d天的终端使用的业务URL集转换成数值相似性集合
第Ui个业务URL在Ti个终端上使用,访问该URL的终端与全部终端占比为Ti/T(T为全部终端数),分析该URL与其他URL之间的相似性(两个URL之间终端使用的重合度*(1-Ti/T))。依次迭代计算业务URL之间的相似性,最后形成业务URL之间的相似性集合。
2. 连续计算一个时间段(月)的URL之间的相似性集合。将该时间段内的每天相似性集合进行数据融合,形成综合分析后的业务URL之间的相似性集合。
3. 将业务URL之间的相似性集合经归一化处理,转换成业务URL之间的关联度值。
4. 分析业务URL之间的关联性,形成强关联的业务URL集。
5. 根据当前终端访问的业务URL,与强关联的业务URL集进行匹配,并与本终端所使用的全部业务URL集进行禁忌搜索,推荐关联的URL。