- 博客(7)
- 资源 (2)
- 收藏
- 关注
原创 【学习笔记】读项亮的《推荐系统实践》_第五章利用上下文信息
个人想法哈,推荐系统三个要素:用户、物品、关联两者的信息(推荐依据)。对于确定的推荐系统而言,用户和物品都是无法选择的,推荐系统的构建就是不断寻找新的推荐依据、并综合现有的推荐依据,设计推荐策略、给用户推荐物品的过程。关键还是推荐依据的寻找,而不是策略或者算法的设定。有了新的信息,比复杂的奇思淫巧强得多。项亮这本书的后几章,都是在描述不同的推荐依据信息,讲述如何利用这些信息了。这章
2013-03-31 23:52:42 2008
原创 【学习笔记】读项亮的《推荐系统实践》_第四章利用用户标签数据
第四章利用用户标签数据介绍UGC(user generated content)的使用。做推荐,一种是通过相似的用户给当前用户推荐物品;一种方法是通过与用户喜欢的物品相似的物品来推荐物品;本章讲的是第三种方法,即用过一些特征(联系用户和物品)来为用户推荐物品。这个特征可以表现为物品属性的集合,也可以表现为隐语义向量,也可以是标签。4.1 UGC标签系统的代表应用列举
2013-03-29 19:41:07 1797
原创 【重新上本科】关于“static”关键字的点滴
在面试的时候,考察语言基础的时候,有时候会遇到问题“static关键字的作用是什么”,以及相关的问题。这篇文章里面尽可能总结的全面一点。对于c语言。static可以修饰c语言的变量,表示静态变量,有个很cool的(或者和普通变量很不一样)的属性,就是他的生命周期与当前的生命周期一样。典型的场景就是:在函数中定义了static变量,在函数外面还能够引用这个变量。经常用来作计数器。这是
2013-03-24 22:15:38 1000
转载 怎样量化评价搜索引擎的结果质量
原文地址:http://www.cnblogs.com/scnucs/archive/2012/10/10/2718503.html 怎样量化评价搜索引擎的结果质量搜索质量评估是搜索技术研究的基础性工作,也是核心工作之一。评价(Metrics)在搜索技术研发中扮演着重要角色,以至于任何一种新方法与他们的评价方式是融为一体的。搜索引擎结果的好坏与否,体现在业界所称的在相关性(
2013-03-19 14:31:05 1146
转载 【java学习】Java应用程序性能调优的原则
原文地址:http://itindex.net/blog/2013/03/01/1362128838467.html这是“ 成为Java GC专家 “系列中的第五篇。 在第一个问题探讨理解Java垃圾收集里,我们已经学会了不同的GC算法的过程,GC如何的工作,新生代和老一代是什么,你应该知道新的JDK 7的5种类型的GC,以及这些GC类型性能的影响有什么。在第二篇文章-
2013-03-10 21:01:26 1241
转载 【NLP基础】相似度计算常用方法综述
原文地址:http://blogread.cn/it/article/5529?f=wb引言相似度计算用于衡量对象之间的相似程度,在数据挖掘、自然语言处理中是一个基础性计算。其中的关键技术主要是两个部分,对象的特征表示,特征集合之间的相似关系。在信息检索、网页判重、推荐系统等,都涉及到对象之间或者对象和对象集合的相似性的计算。而针对不同的应用场景,受限于数据规模、时空开销等
2013-03-06 10:34:46 2024
原创 【基础知识】vc++中的随机数生成算法
前段时间,看网络上流传的靳志辉写的《LDA数学八卦》,里面提到了蒙特卡洛模拟算法,用来抽样模拟特定概率分布的随机样本序列。文中简单提到了,如何生成均匀分布(同余发生器)的随机样本序列以及根据均匀分布能够模拟生成其他主要分布(例如:正态分布)的样本序列。好奇地查了一下现在的均匀分布的模拟方法。随机数可以用物理模拟,我猜想是用某些满足随机分布条件的物理值来实时地模拟。不过程序中经常用的是递推模拟,
2013-03-02 13:22:55 2439
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人