![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 79
C_son
这个作者很懒,什么都没留下…
展开
-
【思路】基于互联网电子产品评论的舆情分析
一、前言 最近在一位研究生的带领下,在研究互联网电子产品评论的舆情分析。觉得这个项目挺有意义的,跟我感兴趣的大数据,数据挖掘这块也很沾边。也看了不少论文了,在此写点我的心得,以及整个project实现的思路。下面我将以某一手机品牌为研究对象。整个工程可以分为数据获取,数据预处理,评论情感分析,成果展示这四个方面。二、数据获取 数据来源的途径有很多,我将它分为两种原创 2015-01-29 14:11:57 · 1781 阅读 · 0 评论 -
【JAVA实现】基于决策树的ID3算法
这个系列的第一篇博客,按照顺序从C4.5算法,了解到它是ID3的升级版,所以决定先对ID3探个究竟。 先申明一下,代码也都是建立在他人的代码之上,所以感谢他们的帮助,我只是在这之上做了一部分修改,并加上了更详尽的注释。“原创”二字满足下虚荣心。废话不多少,直接上代码,至于算法描述,请自行google。 首先是数据集,这里和网上大多数例子一样,用了weka的weath原创 2014-08-17 22:17:16 · 1747 阅读 · 0 评论 -
【JAVA实现】K-近邻(KNN)分类算法
KNN算法属于监督学习算法,是一种用于分类的非常简单的算法。简单的说,KNN算法采用测量不同特征值之间的距离方法进行分类。具体算法如下: 1)计算已知类别数据集中的点与当前点之间的距离 2)按照距离递增次序排序 3)选取与当前距离最小的k个点 4)确定前k个点所在类别的出现频率 5)返回前k个点出现频率最高的类别作为当原创 2015-02-26 21:43:40 · 11223 阅读 · 10 评论 -
【JAVA实现】用Logistic回归进行分类
package logistic;import java.util.List;public class Horse { private List attributes; private String label; public List getAttributes() { return attributes; } public void setAttributes(L原创 2015-03-14 22:54:16 · 5390 阅读 · 5 评论 -
【JAVA实现】层次聚类算法
聚类算法属于机器学习中一种无监督学习算法。聚类方法一般可以分为层次聚类与非层次聚类两种。其中层次聚类算法又可以分为合并法与分解法;同样非层次聚类算法也可以分为多种,常用的有K-means算法。这篇博客先来实现层次聚类算法中的合并法,我会在下一篇博文中讲述K-means算法。 其中,合并法是指:初始阶段,将每个样本点当做其类簇,然后合并这些原子类簇直至达到预期的类簇数或者其他终止条件原创 2015-02-21 22:39:15 · 6920 阅读 · 2 评论 -
【JAVA实现】基于欧几里得度量的相似度计算
前文讲了基于皮尔逊相关系数的相似度计算方法,这次介绍一个更加简单的相似度计算算法——欧几里得度量。 算法描述如下: 欧几里得度量定义欧几里得空间中,点x =(x1,...,xn)和 y =(y1,...,yn)之间的距离为 很简单吧,我也不多做描述了,直接贴代码。package euclideanMetric;/** * @auth原创 2015-02-20 16:39:40 · 6435 阅读 · 0 评论 -
【JAVA实现】基于皮尔逊相关系数的相似度计算
最近在看《集体智慧编程》,相比其他机器学习的书籍,这本书有许多案例,更贴近实际,而且也很适合我们这种准备学习machine learning的小白。 这本书我觉得不足之处在于,里面没有对算法的公式作讲解,而是直接用代码去实现,所以给想具体了解该算法带来了不便,所以想写几篇文章来做具体的说明。以下是第一篇,对皮尔逊相关系数作讲解,并采用了自己比较熟悉的java语言做实现。原创 2015-02-18 12:51:00 · 10412 阅读 · 0 评论 -
【JAVA实现】K-means聚类算法
上一篇博文介绍了层次聚类算法的实现http://blog.csdn.net/c_son/article/details/43900503 ,可以发现其效率比较低下,因为每次迭代都要计算每两个聚簇之间的距离。这次的k-means算法在效率上要优于层次聚类算法。 算法实现: 1)从样本D中随机选取K个元素,作为K个簇的中心 2)分别计算剩下原创 2015-02-22 23:29:15 · 5253 阅读 · 2 评论 -
【JAVA实现】朴素贝叶斯分类算法
之前博客提到的KNN算法以及决策树算法都是要求分类器给出“该数据实例属于哪一类”这类问题的明确答案,正因为如此,才出现了使用决策树分类时,有时无法判定某一测试实例属于哪一类别。使用朴素贝叶斯算法则可以避免这个问题,它给出了这个实例属于某一类别的概率值,然后通过比较概率值,可以找到该实例最有可能属于哪一类别。 该算法可以用如下形式表示: 直接求解概率值很困难,原创 2015-03-13 17:12:38 · 9985 阅读 · 12 评论