自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

C_son的专栏

最新的博客请见: http://shenchao.me/

  • 博客(7)
  • 资源 (1)
  • 收藏
  • 关注

原创 【开源】爬取QQ空间说说及简易数据分析

前几天,一直在学习爬虫,然后最近想到了一个不错的idea,想以这个小demo来结束爬虫的学习。       是这样的:登入qq空间,爬取自己或者好友的所有说说记录,然后区统计分析一共发了多少说说,每条说说的评论有多少,谁评论的最多,有多少赞,谁赞最多,还有可以找出你的qq好友中男女比例多少,来自哪里,什么星座等等。       这里讲下具体思路,具体代码我托管到github,有兴趣的朋友可

2015-02-14 17:48:23 17210 16

原创 【JAVA实现】K-近邻(KNN)分类算法

KNN算法属于监督学习算法,是一种用于分类的非常简单的算法。简单的说,KNN算法采用测量不同特征值之间的距离方法进行分类。具体算法如下:       1)计算已知类别数据集中的点与当前点之间的距离       2)按照距离递增次序排序       3)选取与当前距离最小的k个点       4)确定前k个点所在类别的出现频率       5)返回前k个点出现频率最高的类别作为当

2015-02-26 21:43:40 11314 10

原创 【JAVA图表】Jfreechart常用图表总结

这个寒假在学习机器学习,很多案例中的数据集需要用图表呈现,因此,我总结了一些常用的图表代码,为日后使用提供方便。       说明:以下的代码只涉及极少一部分jfreechart的API,如果想进一步了解,请访问它的主页http://www.jfree.org/jfreechart/ 。并且,以下的代码均不可以直接复制然后运行,需要进一步实现自己的数据集,数据集的接口,我已经预留,大家实现即可

2015-02-26 17:12:38 4111

原创 【JAVA实现】K-means聚类算法

上一篇博文介绍了层次聚类算法的实现http://blog.csdn.net/c_son/article/details/43900503 ,可以发现其效率比较低下,因为每次迭代都要计算每两个聚簇之间的距离。这次的k-means算法在效率上要优于层次聚类算法。              算法实现:       1)从样本D中随机选取K个元素,作为K个簇的中心       2)分别计算剩下

2015-02-22 23:29:15 5285 2

原创 【JAVA实现】层次聚类算法

聚类算法属于机器学习中一种无监督学习算法。聚类方法一般可以分为层次聚类与非层次聚类两种。其中层次聚类算法又可以分为合并法与分解法;同样非层次聚类算法也可以分为多种,常用的有K-means算法。这篇博客先来实现层次聚类算法中的合并法,我会在下一篇博文中讲述K-means算法。       其中,合并法是指:初始阶段,将每个样本点当做其类簇,然后合并这些原子类簇直至达到预期的类簇数或者其他终止条件

2015-02-21 22:39:15 7014 2

原创 【JAVA实现】基于欧几里得度量的相似度计算

前文讲了基于皮尔逊相关系数的相似度计算方法,这次介绍一个更加简单的相似度计算算法——欧几里得度量。       算法描述如下:       欧几里得度量定义欧几里得空间中,点x =(x1,...,xn)和 y =(y1,...,yn)之间的距离为       很简单吧,我也不多做描述了,直接贴代码。package euclideanMetric;/** * @auth

2015-02-20 16:39:40 6475

原创 【JAVA实现】基于皮尔逊相关系数的相似度计算

最近在看《集体智慧编程》,相比其他机器学习的书籍,这本书有许多案例,更贴近实际,而且也很适合我们这种准备学习machine learning的小白。       这本书我觉得不足之处在于,里面没有对算法的公式作讲解,而是直接用代码去实现,所以给想具体了解该算法带来了不便,所以想写几篇文章来做具体的说明。以下是第一篇,对皮尔逊相关系数作讲解,并采用了自己比较熟悉的java语言做实现。

2015-02-18 12:51:00 10463

数据挖掘ID3算法(JAVA实现)

数据挖掘ID3算法(JAVA实现),在许多网上的例子上进行了一部分修改以及加上了更多的注释,希望可以给小白们带来帮助

2014-08-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除