数据挖掘与机器学习
zongquanliu
这个作者很懒,什么都没留下…
展开
-
R语言常用数据挖掘包
今天发现一个很不错的博客(http://www.RDataMining.com),博主致力于研究R语言在数据挖掘方面的应用,正好近期很想系统的学习一下R语言和数据挖掘的整个流程,看了这个博客的内容,心里久久不能平静。决定从今天开始 ...今天发现一个很不错的博客(http://www.RDataMining.com), 博主致力于研究R语言在数据挖掘方面的应用,正好近期很想系统的学转载 2015-04-29 17:16:03 · 862 阅读 · 0 评论 -
LIBSVM使用介绍
http://endual.iteye.com/category/189652原创 2015-05-12 11:05:01 · 369 阅读 · 0 评论 -
spark入门教程及经验总结
一、环境准备测试环境使用的cdh提供的quickstart vmhadoop版本:2.5.0-cdh5.2.0spark版本:1.1.0二、Hello Spark将/usr/lib/spark/examples/lib/spark-examples-1.1.0-cdh5.2.0-hadoop2.5.0-cdh5.2.0.jar 移动到/usr/lib/spark原创 2015-05-05 11:36:39 · 2739 阅读 · 0 评论 -
hadoop实现全局排序的思路
排序思路借鉴快速排序的思路:假设为升序排序,那么每完成一次partition,pivot左边所有元素的值都小于等于pivot,而pivot右边的所有元素的值都大于等于pivot,如果现在有N个pivot,那么数据就被map成了N+1个区间,让reducer个数等于N+1,将不同区间的数据发送到相应区间的reducer;hadoop利用shuffle操作将这N+1份数据自动排序,reduce操作原创 2015-05-19 22:30:06 · 754 阅读 · 0 评论 -
随机选取算法 (有权重的记录中选取)
三类随机问题1. 已有n条记录,从中选取m条记录,选取出来的记录前后顺序不管。 实现思路:按行遍历所有记录,约隔n/m条取一个数据即可2. 在1类情况下,还要求选取出来的m条记录是随机排序的 实现思路: 给n条记录,分别增加一列标记,值为随机选取的1至n之间的不重复数据, 实现参考博文 将文件内容按行随机排列原创 2015-05-20 01:23:18 · 2737 阅读 · 0 评论 -
人脸数据集整理
Hot Face Databases[1] CAS-PEAL Face Database [Download] [2] Face Recognition Grand Challenge (FRGC) v2.0 [Download] [3] Labeled Faces in the Wild (LFW) [Download] [原创 2017-03-22 14:24:51 · 5665 阅读 · 4 评论 -
【论文笔记】Text-Detection
最近在研究一个新课题-Text Detection,正在读论文中。。。201604261、Zhang Z, Zhang C, Shen W, et al. Multi-Oriented Text Detection with Fully Convolutional Networks[J]. arXiv preprint arXiv:1604.04018, 2016.这篇文章转载 2017-04-01 14:33:18 · 439 阅读 · 0 评论