MachineLearning
wonderful_life_mrchi
不登高山,不知天之高也;不临深溪,不知地之厚也
展开
-
通俗易懂掌握Bayes算法
生活中很多场合需要用到分类,比如新闻分类、病人分类等等。本文介绍朴素贝叶斯分类器(Naive Bayes classifier),它是一种简单有效的常用分类算法。一、病人分类的例子让我从一个例子开始讲起,你会看到贝叶斯分类器很好懂,一点都不难。某个医院早上收了六个门诊病人,如下表。 症状 职业 疾病 打喷嚏 护士 感冒 打喷嚏 农夫 过敏转载 2017-08-13 09:17:29 · 10859 阅读 · 0 评论 -
mahout最新版+hadoop2.4.1运行kmeans分布式算法
1、理论须知用过mahout和hadoop集成的朋友们,都经过很多折腾,mahout这个东西是包括了好多的机器学习算法,确实我们调用起来相当方便,毕竟我们不需要为了使用一个算法重新编码。但是mahout0.10之前都只能支持到hadoop1.x版本,所以大部分使用hadoop2.x的朋友,很苦恼,虽然网上各种办法,大都折腾的很,浪费时间且错误百出,鉴于此,将本人集成的成功案例分享给大家,少走弯原创 2017-08-20 21:30:13 · 3968 阅读 · 0 评论 -
趣味入门之机器学习
官方定义:机器学习机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎。案例:1.原创 2017-08-14 14:55:33 · 13832 阅读 · 0 评论 -
KNN分类算法java实现
最近邻分类算法思想KNN算法的思想总结一下:就是在训练集中数据和标签已知的情况下,输入测试数据,将测试数据的特征与训练集中对应的特征进行相互比较,找到训练集中与之最为相似的前K个数据,则该测试数据对应的类别就是K个数据中出现次数最多的那个分类,其算法的描述为:1)计算测试数据与各个训练数据之间的距离;2)按照距离的递增关系进行排序;3)选取距离最小的K个点;4)确定前K个点所在原创 2017-08-23 13:13:46 · 3295 阅读 · 0 评论