网络页面推荐与启动风暴模型研究
1. 网络页面推荐实验评估
- 数据集 :使用中东技术大学计算机工程系网站的服务器日志,时间范围为2011年2月6日至2月18日,以Apache HTTP服务器组合日志格式收集,日志总大小为107MB。
- 评估方法 :通过新网页推荐的准确性来评估方法,为评估计算两个会话之间相似度的度量,进行了推荐(预测)实验。
- 具体操作步骤:
- 设S = A →B →C →D为长度为4的会话,在推荐实验中,从会话中移除最后一项(此处为页面D),尝试使用数据集中的其他会话进行预测。
- 使用有/无时间信息的相似度度量,将会话S′ = A →B →C与数据集中的其他会话进行比较。
- 若页面D在推荐集中,则认为推荐准确,否则不准确。
- 具体操作步骤:
- 推荐算法 :采用k - 最近邻算法。给定测试会话S,移除S中的最后一个URL用于预测,从训练集中选择与S(不包含最后一个URL)最接近的k个会话,并基于这k个最近邻会话预测S的最后一个URL。
- 示例 :设S = A →B →C →D为测试会话,移除最后一项用于推荐,得到S′ = A →B →C,将其映射到概念集序列,从训练集中选择k个最相似的会话。假设k = 2,最接近的序列为S1 = A →B →E →F和S2 = A →C →D。分别将S′与S1和S2对齐,S′和
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



