- 《个性化推荐服务中用户兴趣模型研究》
这完全是一个空想的论文。主要是要获取用户的兴趣分类。用户兴趣包括用户浏览的网页,以及对每个网页的兴趣度。
基本上就是:对网页的兴趣做聚类。用户的浏览时间和下拉框点击次数,要统计比较难。
2.《基于大规模日志分析的网络搜索引擎用户行为研究》
搜狗的搜索引擎查询日志作为基础。统计query的各种数据。
query 用户提交的查询
URL 用户点击的结果地址
time 用户点击发生时的日期、时间
rank 该URL在返回结果中的排名
order 用户点击的顺序号(这是用户点击的第几个页面)
id 由系统自动分配的用户标识号
submitter information 浏览器信息,计算机信息