Data mining and Machine Learni
薄荷微光少年梦
这个作者很懒,什么都没留下…
展开
-
我裂解的机器学习(ML)
机器学习是指一套工具、方法或程式,使到我们可以从现实世界的海量数据里提炼出有价值的知识,规则和模式,然后将它们反哺给前台应用系统,进行预测,推荐等能产生直接经济价值的场景,给用户带来“机器具备人类般高智能”的震撼性体验。对于数据越来越多,而人力成本又越来越高的大数据时代,机器学习能降低企业进行数据分析的成本,掌控有关技术,可以给企业和个人带来巨大的价值。机器学习,人工智能,数据挖掘,模原创 2014-07-31 14:01:51 · 675 阅读 · 0 评论 -
使用mahout进行数据挖掘
mahout使用:步骤一:tar -xvf mahout-0.3.tar.gz需要指定hadoop的路径和配置文件的路径export HADOOP_HOME=/home/hadoopuser/hadoop-0.19.2 export HADOOP_CONF_DIR=/home/hadoopuser/hadoop-0.19.2/conf步骤二:通过转载 2014-07-31 09:55:25 · 1019 阅读 · 0 评论 -
数据处理:离散化好处多
离散化指把连续型数据切分为若干“段”,也称bin,是数据分析中常用的手段。切分的原则有等距,等频,优化,或根据数据特点而定。在营销数据挖掘中,离散化得到普遍采用。究其原因,有这样几点:①算法需要。例如决策树,NaiveBayes等算法本身不能直接使用连续型变量,连续型数据只有经离散处理后才能进入算法引擎。这一点在使用具体软件时可能不明显。因为大多数数据挖掘软件内已经内建了离散化处理程序,所转载 2015-09-09 14:35:56 · 10267 阅读 · 0 评论 -
weka:SimpleKMeans实现Class to clusters evaluation验证
今天利用weka实现聚类的时候遇到如何使用java实现Class to clusters evaluation的问题,上面是核心代码。原创 2015-10-18 20:51:38 · 5822 阅读 · 0 评论 -
Weka各类分类器的使用(Java)
1.配置MyEclipse2013+Weka3.6+libsvm3.18+Jdk1.7+Win8.12.小Tips1). Java使用Weka实现:将安装文件夹里的weka.jar加入项目编译路径中2). CSV文件可以转换成Arff文件实现:运行Weka的Explorer界面,打开csv文件,保存为arff文件。注意:转载 2015-09-20 21:12:11 · 3595 阅读 · 1 评论 -
Weka-读懂TP Rate ,FP Rate, Precision, Recall, F-Measure, ROC Area,
True Positive (真正, TP)被模型预测为正的正样本;True Negative(真负 , TN)被模型预测为负的负样本 ;False Positive (假正, FP)被模型预测为正的负样本;False Negative(假负 , FN)被模型预测为负的正样本;True Positive Rate(真正率 , TPR)或灵敏度(sensitivi原创 2015-09-21 17:15:57 · 21082 阅读 · 0 评论 -
如何将WEKA中的分类器Model提取出来
源自:http://weka.wikispaces.com/Serialization最近的一个项目涉及到一些数据挖掘的内容, 因此,接触了WEKA,不得不承认,对于菜鸟来说,WEKA,确实是一个很不错的工具。他的好处太多了,不一一赘述,刚开始,就有个以为就是,用WEKA训练好的model,以后如何使用,这次知道了,看如下翻译:Serialization i翻译 2015-09-21 16:00:43 · 6042 阅读 · 0 评论 -
KNN(K-Nearest Neighbor)分类算法原理
https://blog.csdn.net/shenziheng1/article/details/718911261.什么是看KNN算法?最简单最初级的分类器是将全部的训练数据所对应的类别都记录下来,当测试对象的属性和某个训练对象的属性完全匹配时,便可以对其进行分类。但是怎么可能所有测试对象都会找到与之完全匹配的训练对象呢,其次就是存在一个测试对象同时与多个训练对象匹配,导致一个训练...转载 2019-06-07 06:03:51 · 750 阅读 · 0 评论 -
学习,使用主成分分析 (Principal components analysis,PCA)处理数据必看文章
强烈推荐如下高质量博文:https://blog.csdn.net/watkinsong/article/details/8234766#commentsedit我的pca迷惑迷惑一刚开始接触PCA的时候,咨询了一个浙大的博士朋友,这朋友告诉我,如果对训练样本进行降维,那么样本的数量必须大于特征的维数,然后我当时就迷惑了,那我怎么办啊,我的人脸表情图像顶多有几百张就算多的了,但是...转载 2019-06-19 14:59:14 · 3121 阅读 · 1 评论