自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

大魁的专栏

推荐系统、计算广告、机器学习、计算机视觉;fancyspeed@weibo; fancyspeed@github

  • 博客(9)
  • 资源 (1)
  • 收藏
  • 关注

原创 各大推荐引擎资料汇总

最近在做一个推荐的任务,头绪繁多,回头看看同行的工作,希望能有些帮助。零零碎碎看过好多资料,有些已经忘记了,会慢慢补全。也欢迎大家留言补充,尤其是关于豆瓣、新浪微博等的系统经验。之前在推荐系统大会上听过土豆、淘宝和点评的报告,收获不少。欢迎同行加我微博进行交流。视频类Netflix:很多方法的融合,策略可以参考我翻译的blog,架构参考小鱼儿师兄的blog。Hulu

2012-08-28 09:36:44 14109 2

转载 R,不仅仅是一种语言

打算抽时间学习R了,每次都写一堆琐碎的python实在太痛苦了。原文链接:http://www.wentrue.net/blog/?p=1083R,不仅仅是一种语言本文原载于《程序员》杂志2010年第8期,因篇幅所限,有所删减,这里刊登的是全文。简介:R是什么工欲善其事,必先利其器,作为一个战斗在IT界第一线的工程师,C/C++、java

2012-08-28 17:20:49 5304

原创 论文笔记-recsys'12-Xbox推荐系统: Bayesian MF

1. 论文简介下载地址:http://www.eng.tau.ac.il/~noamk/papers/KNPS12.pdf文章发表在Recsys 2012上,作者是微软以色列Herzliya研发中心的。2. 论文场景主要为了解决微软Xbox Live Marketplace上的游戏和电影推荐。因此希望推荐算法能够做到跨领域(cross-domain)。3. 数据特点Xb

2012-08-28 08:05:40 2901 1

原创 单机模式处理大数据,搜集一些好用的开源利器

1. LibFM项目主页:http://www.libfm.org/2. Svdfeature项目主页:http://apex.sjtu.edu.cn/apex_wiki/svdfeature3. Libsvm和Liblinearlibsvm项目主页:http://www.csie.ntu.edu.tw/~cjlin/libsvm/liblinear项目

2012-08-27 19:28:42 4668 3

翻译 Collaborative filtering with GraphChi

原文链接:Collaborative filtering with GraphChi本文是GraphChi平台的协同过滤工具箱的快速指南。到目前为止,已经支持ALS(最小二乘法)、SGD(随机梯度下降)、bias-SGD(带偏置的随机梯度下降)、SVD++、NMF(非负矩阵分解)、SVD(restarted Lanczos、one sided Lanczos,svd可以参考left

2012-08-27 19:07:01 9377

原创 度量学习(Distance Metric Learning)介绍

一直以来都想写一篇metric learning(DML)的综述文章,对DML的意义、方法论和经典论文做一个介绍,同时对我的研究经历和思考做一个总结。可惜一直没有把握自己能够写好,因此拖到现在。先烈一些DML的参考资源,以后有时间再详细谈谈。1. Wikipedia2. CMU的Liu Yang总结的关于DML的综述页面。对DML的经典算法进行了分类总结,其中她总结的论文非常有

2012-08-19 23:52:43 43829 14

原创 KDD2012参会小结

KDD的全称为ACM SIGKDD conference on Knowledge Discovery and Data Mining,今年的会期是8.12-8.16,在北京的国家会议中心。这是KDD第一次在亚洲举办,机会难得;加之我们组幸运的被邀请在KDDCUP的workshop上做一个报告,我们5位同学就欢快地从上海赶赴北京学习、腐败了。今年参会人数有1000多人,虽然不能跟SIG

2012-08-19 12:27:07 9301 6

原创 在线广告的exploration/exploitation trade-off(勘探和开采问题)

刚刚在看ICML 2010的一篇关于搜索广告CTR预估的文章:Web-Scale Bayesian Click-Through Rate Prediction for Sponsored Search Advertising in Microsoft’s Bing Search Engine上周跟中科院的同学吃饭时,他们说在KDDCUP竞赛时,这篇文章的算法效果非常好。当时就想好好读一

2012-08-05 15:12:25 5116 2

原创 近两年顶级会议上关于Distance Metric Learning的paper清单

上次大师兄回上海,跟导师以及师兄弟吃饭。谈到我研究生时选的DML的方向,我还是觉得这个领域相对比较艰深,近几年一直没有大的进展,而且凭直觉认为DML相关的最近的paper不会特别多。导师笑而不语。回来做了一点功课,搜罗了这2年顶级会议上度量学习相关的论文,数量之多,颇受震动。这其中怕是不乏灌水炒作新概念的文章,看来DML大有前几年sparse coding的势头啊。ICML 2012M

2012-08-05 10:48:37 11931 7

graphchi 0.1.2源码

graphchi是卡内基梅隆大学开发的,单机模式进行大规模数据挖掘的工具

2012-09-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除