数据挖掘
文章平均质量分 91
LiFeitengup
大连理工大学数学硕士在读关注计算机视觉机器学习数据分析Email-lifeiteng0422gmail.com
展开
-
The Elements of Statistical Learning学习开篇
这学期开了机器学习讨论班,为了下学期的《机器学习与数据分析》课程做准备。先期讲解《The Elements of Statistical Learning》这本书,此书已经出到第二版。豆瓣截图:评价非常高 本书主页:http://www-stat.stanford.edu/~tibs/ElemStatLearn/ Trevor Hastie, Robert Tibsh原创 2012-11-30 20:47:16 · 4146 阅读 · 0 评论 -
聚类小文(一)
聚类 二维空间中六个数据点集原创 2013-05-29 23:58:48 · 1855 阅读 · 0 评论 -
推荐系统—影视评分预测(续)
在上一篇文章推荐系统—影视评分预测中提出了,几点思考:=============================一、theta/x的意义?=============================首先是模型:以下的model1/model2都把user想简单了(1)model1:给定x=(romance,action),回归优化theta。首先模型就给x赋予了意义(movi原创 2013-06-29 21:45:31 · 4919 阅读 · 9 评论 -
Map-Reduce Algorithm Design
记录: map-reduce design pattern 初始化应该尽可能放到 configure中例子1.word count优缺点:===================================Combiner Design (mean1+mean2)/cnt = mea原创 2013-10-04 21:41:46 · 3612 阅读 · 0 评论 -
文本自动分类
文本自动分类 python原创 2013-10-04 19:05:01 · 13166 阅读 · 7 评论 -
文本自动分类(续)
文本自动分类 朴素贝叶斯原创 2013-10-09 19:02:50 · 5069 阅读 · 1 评论 -
K-Means 和K-Medoids算法及其MATLAB实现
K-Means和K-Medoids算法是学习领域比较普通的聚类算法(无监督学习),本文介绍原理及Matlab实现代码。1.问题: 给定数据点集P,d-by-N,将这些数据点集聚类到K类中去同时要求下式值最小:Sk是聚类形成的数据集合,mk是每个类集合的“中心”——K-Means与K-Medoids唯一不同的地方原创 2012-11-30 22:38:34 · 21423 阅读 · 8 评论 -
基于用户的最近邻推荐
课程 Python代码:__author__ = 'LiFeiteng(Email: lifeiteng0422@gmail.com)'# -*- coding: utf-8 -*-import numpy as npclass UserUserRec: def __init__(self): self.U = 0 # user number self.M = 0 #原创 2013-10-22 16:51:32 · 3484 阅读 · 1 评论