算法实现
文章平均质量分 78
phoebe_IT
开始记录自己成长的点滴,以防自己回首时,发现自己什么都没有留下来。
展开
-
Weka聚类算法的两个实现算法
这是转自博友的博客,讲解了java调用weka两种聚类算法的demo,在调用之前,必须下载weka jar包导入eclipse里面,并下载weka自带的数据集 进行测试;本人只是进行了简单的测试,发现算法可以完美调用,但是算法的精髓还有待深入理解;转载自:http://rangerwolf.iteye.com/blog/2012208在这里将使用Weka自带的K-mea转载 2015-11-11 16:40:03 · 948 阅读 · 0 评论 -
开源机器学习新工具RWeka(R Meets Weka )
背景介绍: #此前在首页部分显示#1)Weka: Weka有两种意思:一种不会飞的鸟的名字,一个机器学习开源项目的简称(Waikato Environment for Knowledge Analysis,http://www.cs.waikato.ac.nz/~ml/weka/)。我们这里当然要介绍的是第二种意思啦,Weka项目从1992年开始,由新西兰政府支持,现在已在机器学习领域大名转载 2015-11-18 16:42:06 · 625 阅读 · 0 评论 -
MapReduce Kmeans聚类算法
转载自:http://www.cnblogs.com/chaoku/p/3748456.html这个哥们挺用心的,把这个kmeans代码注释的很好,思路相当清晰,学习了!最近在网上查看用MapReduce实现的Kmeans算法,例子是不错,http://blog.csdn.net/jshayzf/article/details/22739063但注释太少了,而且参数转载 2015-12-17 18:33:02 · 898 阅读 · 0 评论 -
结合Scikit-learn介绍几种常用的特征选择方法
转载自:http://www.cnblogs.com/hhh5460/p/5186226.html结合Scikit-learn介绍几种常用的特征选择方法作者:Edwin Jarvis特征选择(排序)对于数据科学家、机器学习从业者来说非常重要。好的特征选择能够提升模型的性能,更能帮助我们理解数据的特点、底层结构,这对进一步改善模型、算法都有着重要作用。特征选择转载 2016-03-20 00:05:50 · 2300 阅读 · 0 评论 -
Word2vec的词聚类结果与LDA的主题词聚类结果,有什么不同?
简单的说,词向量所体现的是语义(semantic)和语法(syntactic)这些 low-level的信息。而LDA的主题词表现的是更 high-level的文章主题(topic)这一层的信息。所以Word2vec的一些比较精细的应用,LDA是做不了的。比如:1)计算词的相似度。同样在电子产品这个主题下,“苹果”是更接近于“三星”还是“小米”?2)词的类比关系:vecto翻译 2016-03-21 22:46:09 · 5540 阅读 · 0 评论 -
python 利用sklearn自带的模块 快速简单实现文章的 tfidf向量空间的表示
# coding=utf-8mydoclist = [u'温馨 提示 : 家庭 畅享 套餐 介绍 、 主卡 添加 / 取消 副 卡 短信 办理 方式 , 可 点击 文档 左上方 短信 图标 即可 将 短信 指令 发送给 客户',u'客户 申请 i 我家 , 家庭 畅享 计划 后 , 可 选择 设置 1 - 6 个 同一 归属 地 的 中国移动 网 内 号码 作为 亲情 号码 , 组建原创 2016-03-22 15:27:59 · 9501 阅读 · 0 评论 -
文章的 tfidf原理的python实现
python tfidf原理简单实现 根据http://www.jb51.net/article/64695.htm 上面的原理,进行简单的注解,让自己进行了梳理# coding:utf-8# 改变自:http://www.jb51.net/article/64695.htm 并进行了注解from sklearn.feature_extraction.text import Cou原创 2016-03-22 16:31:34 · 2222 阅读 · 0 评论 -
泰坦尼克号:幸存人数预测数据分析:原来也可以很简单
泰坦尼克号:数据分析数据:12个字段;训练集892条记录;测试数据集:418条记录?PassengerId => 乘客ID?Pclass => 乘客等级(1/2/3等舱位)?Name => 乘客姓名?Sex => 性别?Age => 年龄?SibSp => 堂兄弟/妹个数?Parch => 父母与小孩个数?Ticket => 船原创 2016-03-23 17:49:22 · 9807 阅读 · 1 评论 -
一、常见算法之排序算法简单描述
转载自:https://www.cnblogs.com/bulingpan/p/6416351.html一、常见算法之排序算法简单描述1、冒泡排序基本思想:两两比较,小的上浮,大的下沉。算法描述:对一组数据,两个两个的依次比较,将小数放到前面,大数放到后面(小的上浮,大的下沉)第一次排序:首先比较第1个和第2个数,将小数放前,大数放后。然后比较第2个数和第3个数,将小数放前,大...转载 2018-12-28 18:07:21 · 395 阅读 · 0 评论