数据挖掘
文章平均质量分 80
wbglearn
语音识别 机器学习 推荐系统 深度学习欢迎和大家讨论和交流。
展开
-
基于物品的协同过滤推荐算法——读“Item-Based Collaborative Filtering Recommendation Algorithms” .
最近参加KDD Cup 2012比赛,选了track1,做微博推荐的,找了推荐相关的论文学习。“Item-Based Collaborative Filtering Recommendation Algorithms”这篇是推荐领域比较经典的论文,现在很多流行的推荐算法都是在这篇论文提出的算法的基础上进行改进的。 一、协同过滤算法描述 推荐系统应用数据分析技术,转载 2013-08-25 22:32:48 · 1781 阅读 · 0 评论 -
十大数据挖掘算法
国际权威的学术组织the IEEE International Conference on Data Mining (ICDM) 2006年12月评选出了数据挖掘领域的十大经典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Naive Bayes, and CART.不仅仅是选中的十大算法,其实参加评选的18种算法,实际转载 2013-09-07 14:18:40 · 1207 阅读 · 0 评论 -
Weka数据挖掘
WEKA的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),它的源代码可通过http://www.cs.waikato.ac.nz/ml/weka得到。同时weka也是新西兰的一种鸟名,而WEKA的主要开发者来自新西兰。详见 http://www.china-pub.com/computers/common/info.as转载 2013-09-07 14:23:35 · 1764 阅读 · 0 评论 -
数据集-用于数据挖掘、信息检索、知识发现等
1、气候监测数据集 http://cdiac.ornl.gov/ftp/ndp026b2、几个实用的测试数据集下载的网站http://www.cs.toronto.edu/~roweis/data.htmlhttp://www.cs.toronto.edu/~roweis/data.htmlhttp://kdd.ics.uci.edu/summary.task.type.h转载 2013-09-07 14:38:19 · 1239 阅读 · 0 评论 -
致2013级学弟学妹----语音和其他
今天由于去教研室弄研究生数学建模,很开心由于我的到来,大家都来实验室。然而,大家在教研室做的事情让我感觉大家还是比较迷茫。而我又是一个多事的人,所以特写下此文,希望可以可以给大家一些帮助,如有任何问题,欢迎讨论。 ok,进入正题。 首先,我来说说语音的事情吧。实验室的很多事情都和语音有关,所以做图像和视频的或许你只是借鉴这些想法吧。第一,介绍书吧。网址:http://n原创 2013-09-08 20:25:15 · 3424 阅读 · 4 评论 -
推荐系统论文分类推荐
推荐系统论文分类推荐搭建1、http://www.cnblogs.com/vivounicorn/archive/2011/09/20/2182433.html2、http://www.cnblogs.com/vivounicorn/archive/2011/10/08/2201986.html3、https://cwiki.apache转载 2013-09-02 16:39:21 · 1607 阅读 · 0 评论 -
推荐系统的循序进阶读物(从入门到精通)
推荐系统-从入门到精通为了方便大家从理论到实践,从入门到精通,循序渐进系统地理解和掌握推荐系统相关知识。特做了个读物清单。大家可以按此表阅读,也欢迎提出意见和指出未标明的经典文献以丰富各学科需求(为避免初学者疲于奔命,每个方向只推荐几篇经典文献)。1. 中文综述(了解概念-入门篇)a) 个性化推荐系统的研究进展b) 个性化推荐系统评价方法综述2. 英文综述(了解概念-进阶篇转载 2013-09-09 17:08:38 · 1310 阅读 · 1 评论 -
国内外推荐系统应用总结
最近对推荐系统非常有兴趣,也在做一些这方面的研究。学习成熟的产品是提升自己产品的一个非常好的方法,所以在这里,我会总结一些国内外推荐系统方面的应用,肯定不会写的全,所以还希望看到这篇文章的童鞋可以帮忙补充。1、商城系统:说起商城系统,甚至说起推荐系统,当然会首推Amazon,Amazon是国内外做推荐系统起步最早的一批公司,而且现在是做的最好的。当你进入首页后,你会看到系统转载 2013-09-02 16:41:14 · 4672 阅读 · 0 评论 -
克服长尾挑战 (Overcoming the Long Tail Challenge)
1. 幂律分布无处不在 (Overcoming the Long Tail Challenge)" name="image_operate_58741321438732921" alt="克服长尾挑战 (Overcoming the Long Tail Challenge)" src="http://s2.sinaimg.cn/middle/7ad48feehb1d7693b51f1&6转载 2013-10-15 23:45:58 · 1573 阅读 · 0 评论 -
公开课可下载资源汇总
微博上经常有同学分享一些公开课资源,包括可下载的网盘资源,课件资源等等,但是时间长了就忘了在哪里了。另外Coursera官方也推荐一 些第三方批量下载工具,大家下载课程后也可以考虑共享到网盘里,减轻Coursera官方的下载压力。这里计划做一个汇总,包括一些佚名的来自网络上的课 程资源分享,也欢迎大家提供线索或者补充公开课网盘资源。1、Coursera上Andrew Ng老师的”机器学习公开课转载 2013-10-26 22:31:46 · 4908 阅读 · 0 评论 -
一位数据挖掘成功人士给数据挖掘在读研究生的建议
关于数据挖掘方面的研究,我原来也走过一些弯路。其实从数据挖掘的起源可以发现,它并不是一门崭新的科学,而是综合了统计分析、机器学习、人工智能、数据库等诸多方面的研究成果而成,同时与专家系统、知识管理等研究方向不同的是,数据挖掘更侧重于应用的层面。因此来说,数据挖掘融合了相当多的内容,试图全面了解所有的细节会花费很长的时间。因此我建议你的第一步是用大概三个月的时间了解数据挖掘的几个常用技术:分转载 2013-09-07 12:43:23 · 1806 阅读 · 0 评论 -
数据挖掘
以下是咱经常去的数据挖掘牛人的网站,吸收了很多精华,也开阔了自己的思路。很感谢他们分享的思想,很是值得学习。韩家炜http://www.cs.uiuc.edu/~hanj/著名数据挖掘书籍,《数据挖掘概念和技术》作者,在DM界久负盛名。他的个人主页里面有很多他的papers,都非常经典;还有他所教授的课程,可以下载课件学习。Jian Peihttp://www.cs.sfu.c转载 2013-08-28 15:02:30 · 1304 阅读 · 0 评论 -
推荐系统相关资源汇总 .
为了更好的学习推荐系统,本博文将个人知道的关于推荐系统的相关资源整理汇总,拿出来与大家分享。本博文每月更新一次,长期维护,如果你有好的关于推荐系统的资源,请email我,放到这里与大家分享。主页GroupLens: http://www.grouplens.org GroupLens项目官方主页John Riedl: http://www-users.cs.umn.edu/~rie转载 2013-08-25 22:23:27 · 1133 阅读 · 0 评论 -
Amazon和Google使用的推荐方法简述 .
本博文讨论下不同的推荐方法,包括Amazon和Google使用的推荐方法。维基百科给推荐系统的定义是:推荐系统是一种特定的信息过滤技术,它在试图向用户呈现用户可能感兴趣的信息(电影、音乐、图书、新闻、图片、网页等等)。维基百科上同时指出,推荐通常是基于信息项目的(基于内容的推荐技术)或者基于用户的社会环境的(协同过滤推荐技术)。我们认为还有一种个性化的方法,就是Google重点使用的那种技术方法。转载 2013-08-25 22:22:37 · 1186 阅读 · 0 评论 -
推荐系统五大问题
本文翻译于互联网观察媒体“读写网”在2009年初发布的一篇文章。读写网在2009年初的时候编辑了一系列针对推荐系统的文章,在荷兰阿姆斯特丹举办的一次专门针对推荐系统的兴趣小组会议上,一些公司提出了实施和建设推荐系统需要面对的几个问题,本文针对这些问题,进行了初步的分析。在此与大家分享:1. 缺少数据对于推荐系统来说,可能最大的问题就是需要大量的数据才能产生推荐结果。这也是为什么那些表现转载 2013-08-25 18:16:59 · 1762 阅读 · 0 评论 -
推荐系统算法总结
转自阿俊的博客最近看推荐系统方面的东西也有段日子了,有书,博客,唯独没有看论文。总感觉论文对于工业界来说用处真的不如学校做课题、论文那么大,只要知道某个算法好不好用以及怎么用就可以了,也不必知道太多的细节和数学推导。但根据一个好的算法,产品部门可以设计出很多很酷的产品,让用户倍感web应用的人性化。在看书,看大牛们的博客时,学习到了很多算法和思路。现在总结一下:1、Item b转载 2013-08-25 18:15:17 · 1064 阅读 · 0 评论 -
各大推荐引擎资料汇总
最近在做一个推荐的任务,头绪繁多,回头看看同行的工作,希望能有些帮助。零零碎碎看过好多资料,有些已经忘记了,会慢慢补全。也欢迎大家留言补充,尤其是关于豆瓣、新浪微博等的系统经验。之前在推荐系统大会上听过土豆、淘宝和点评的报告,收获不少。欢迎同行加我微博进行交流。视频类Netflix:很多方法的融合,策略可以参考我翻译的blog,架构参考小鱼儿师兄的blog。Hulu转载 2013-08-25 18:13:53 · 1087 阅读 · 0 评论 -
搜索引擎算法之初探——PageRank、DocRank
从文档集合中找出出现搜索词的文档,进一步可能是通过搜索词在文档中出现的次数来对文档排名,这种搜索就是信息检索(Information retrieval)。有很多现有的库可以很方便的就让我们做出来这些工作,其中最有名的当属Lucene了。当然,现在的搜索已不单单是索引了,而在于链接分析、用户点击分析和自然语言处理等方面,这些技术能大大的增强搜索的性能。基本搜索构建一个搜索引擎的基本步骤转载 2013-08-20 19:41:06 · 1373 阅读 · 0 评论 -
数据挖掘中所需的概率论与数理统计知识、上
数据挖掘中所需的概率论与数理统计知识、上(关键词:微积分、概率分布、期望、方差、协方差、数理统计简史、大数定律、中心极限定理、正态分布)导言:本文从微积分相关概念,梳理到概率论与数理统计中的相关知识,但本文之压轴戏在本文第4节(彻底颠覆以前读书时大学课本灌输给你的观念,一探正态分布之神秘芳踪,知晓其前后发明历史由来),相信,每一个学过概率论与数理统计的朋友都有必要了解数理统计学转载 2013-08-13 19:52:07 · 2116 阅读 · 0 评论 -
从决策树学习谈到贝叶斯分类算法、EM、HMM
第一篇:从决策树学习谈到贝叶斯分类算法、EM、HMM(Machine Learning & Data Mining交流群:8986884)引言最近在面试中,除了基础 & 算法 & 项目之外,经常被问到或被要求介绍和描述下自己所知道的几种分类或聚类算法(当然,这完全不代表你将来的面试中会遇到此类问题,只是因为我的简历上写了句:熟转载 2013-07-20 20:24:26 · 2384 阅读 · 0 评论 -
北美18名校的数据挖掘,数据分析,人工智能及机器学习课程汇总
问答http://www.quora.com/What-is-data-science 数据科学是什么?http://www.quora.com/How-do-I-become-a-data-scientist 我怎样才能成为一个数据科学家?http://www.quora.com/Data-Science/How-does-data-science-differ-fr转载 2013-07-13 13:35:10 · 1410 阅读 · 0 评论 -
看懂信息检索和网络数据挖掘领域论文的必备知识总结
信息检索和网络数据领域(WWW, SIGIR, CIKM, WSDM, ACL, EMNLP等)的论文中常用的模型和技术总结引子:对于这个领域的博士生来说,看懂论文是入行了解大家在做什么的研究基础,通常我们会去看一本书。看一本书固然是好,但是有一个很大的缺点:一本书本身自成体系,所以包含太多东西,很多内容看了,但是实际上却用不到。这虽然不能说是一种浪费,但是却没有把有限力气花在刀口上。转载 2013-10-27 12:48:01 · 1269 阅读 · 0 评论