R&datamine
largetalk
技术宅,享受coding, python粉丝,热爱c, linux,想找个人一起去旅行
展开
-
初学R,练个手
随机扔2个色子,求相加之和的数出现概率> data <- outer(1:6, 1:6, "+")> data [,1] [,2] [,3] [,4] [,5] [,6][1,] 2 3 4 5 6 7[2,] 3 4 5 6 7 8[3,] 4 5 6 7 8 9原创 2012-01-12 00:07:36 · 825 阅读 · 0 评论 -
k-mean算法实现
k-means 算法的工作过程说明如下: 初始化:聚类数k,初始聚类中心x,迭代次数或者收敛条件。 首先,从n个数据对象任意选择 k 个对象作为初始聚类中心;而对于所剩下其它对象,则根据它们与这些聚类中心的相似度(距离),分别将它们分配给与其最相似的(聚类中心所代表的)聚类; 然后,再计算每个所获新聚类的聚类中心(该聚类中所有对象的均值); 再次,不断重复上面的过程直到满足原创 2012-05-31 23:30:45 · 1686 阅读 · 0 评论 -
线性代数复习
正交矩阵: 它的转置矩阵就是它的逆矩阵, QTQ = QQT = I对角矩阵: 方阵M所有非主对角线元素全等于零的矩阵。 (主对角线元素: 元素两个下标相等)svd, 奇异值分解: 矩阵M = UΣVT, U和V是正交矩阵, Σ是非负对角阵, Σ对角线上的元素即为M的奇异值。M 是m*n, U是m*m, Σ是m*n, VT是n*n特征值与特征向量:Αξ = λξ, 在变换的原创 2012-12-04 09:33:42 · 1047 阅读 · 0 评论 -
推荐学习笔记-协同过滤
协同过滤是推荐系统中用的比较多的算法,也是容易理解较简单的算法,而且效果也不错。协同过滤又分为:item-based collaborative filtering: 喜欢这个物品的人还喜欢什么, 代表有amazonuser-based collaborative filtering: 和我相似的人还喜欢什么, 代表有digg两种方法计算类似,先要找出相似的item或use原创 2012-12-04 23:28:59 · 995 阅读 · 0 评论 -
推荐学习笔记-协同过滤2
书接上文 推荐学习笔记-协同过滤显式数据: 用户的评分,like or unlike等隐式数据: 用户点击,购买记录,在某个页面停留时间,播放次数等调整的余弦相似度:, 对于用户每个评分都要减去该用户平均评分作为他的最终评分,然后计算相似度Slope One:解释是一个物品别人的评分比另一个物品高,那给你的预测也是如此。分两步:第一步,算出所原创 2012-12-07 22:09:47 · 626 阅读 · 0 评论 -
推荐学习笔记-概率和朴素贝叶斯
先验概率(prior probability): 对一个假设(hypothesis)/事件 发生已知的概率,记为P(h)。如: 抛一枚硬币,证明朝上的先验概率是 P(h) = 0.5后验概率(posterior probability): 在特定数据/情景下,某事件发生的概率, 记为P(h|d).P(D): 某事/条件出现的概率P(D|h): 在h发生时, 某事出现的概率。原创 2012-12-16 20:11:22 · 1483 阅读 · 0 评论