- 博客(2)
- 资源 (5)
- 收藏
- 关注
原创 kaggle competition 之 Titanic: Machine Learning from Disaster
Kaggle是一个数据科学竞赛平台(making data science a sport),在上面,很多机构会发布研究问题和数据集提供大家解决,有些会有报酬。第一次看到这个网站就觉得它会火,在信息爆炸时代,通过挖掘历史数据来对业务提供更有效的服务已经是大势所趋。而kaggle上的题目都是偏向数据挖掘类的,这相比ACM或者projecteuler这种纯算法的题要更有专业和更开放;一个题一般都会有一
2012-10-23 11:59:26 3768 3
原创 elasticsearch学习入门
这几年,搜索的开发门槛越来越低,每个语言都有开源的检索工具包,而且功能越来越全,完整的解决方案也越来越多、越来越好用,比如lucene上就有solr, elasticsearch, sensei等。它们对于绝大部分的需求应该说都覆盖了,解放了直接在检索工具包上的开发工作量,让人可以更多关注业务上的开发。个人比较看好elasticsearch(简称ES),ES的使用非常简单,让人感觉更多地在使用
2012-10-09 20:04:08 14169 3
几个推荐算法的java实现
2012-01-05
基于随机游走的社团发现算法Hadoop版
2011-07-07
二进制串模糊搜索的Java实现0.11
2011-06-04
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人