数据挖掘
leexurui
这个作者很懒,什么都没留下…
展开
-
手写数字识别的机器学习方法讨论
KNN算法:好多样本(比如500个),每个样本存了一个0和1描述的矩阵(一般的数字图片可经过预处理(二值化,平滑去噪归一化)等方式变成类似的存储结构),类似下图,并告诉该样本是数字几。然后我们在程序中,把这个矩阵变成一行向量,然后把这500个样本的行向量存到一个矩阵或者哈希表中。然后我们取一个需要判别数字的样本,把它的矩阵也变成行,然后循环分别求它跟上面500个样本行的欧式距离原创 2016-08-29 12:50:43 · 2061 阅读 · 0 评论 -
Large Scale Dist…
原文地址:Scale Distributed Deep Networks 中译文">Large Scale Distributed Deep Networks 中译文作者:DeepLearner大规模分布式深度网络(Large Scale Distributed DeepNetworks)Jeffrey Dean, Greg S. Corrado,Rajat Monga,转载 2016-08-29 12:51:03 · 659 阅读 · 0 评论 -
社交网络分析:网络中心性
原文地址:社交网络分析:网络中心性作者:酸嘢本文为Social NetworkAnalysis学习笔记,课程地址为https://www.coursera.org/course/sna。对于中心性(centrality)的不同观点在下面每一个网络中,X都相对Y具有更高的中心性。定量度中心性在每个节点上标注节点度。例如,拥有朋友越多的节点其中心性越高。其标准化就是用节点度除以最大转载 2016-08-29 12:51:22 · 13282 阅读 · 0 评论 -
读书笔记之三十二----《信用…
原文地址:读书笔记之三十二----《信用评分模型技术与应用》(一)作者:zhaoxq第一章信用评分模型在消费信贷管理中的应用 从数理分析技术发展的层次上讲,信用评分模型的发展经历了3个历史阶段: 1、以客户分类为核心的信用分析。使用一些描述性统计方法来对客户资信信息进行简单分析、分类。 2、以预测模型为核心的信用评分模型。至今是欧美消费信贷管理中使用最广泛、发展最完善的技术。转载 2016-08-29 12:51:38 · 1689 阅读 · 0 评论 -
数据挖掘技术(四)——聚类
原文地址:数据挖掘技术(四)——聚类作者:人生的悲哀4、聚类聚类分析提供由个别数据对象到数据对象所指派到簇的抽象。此外,一些聚类技术使用簇原型(即代表簇中其他对象的数据对象)来刻画簇的特征。聚类分析是研究发现最具有代表性的簇原型的技术。回归和PCA的时间复杂度都是O(m2)。注意:簇的定义是不精确的,而最好的定义依赖于数据的特征和期望的结果。聚类分析与其他将数据对象分组的技术有关。监督学习(也转载 2016-08-29 12:51:43 · 8192 阅读 · 0 评论 -
Weka 分类 注意点
注意点:1、格式最好是weka默认的arff格式。不过weka也可以打开csv格式的文件(csv格式可以用空格、tab或者逗号隔开都行,但是一定要统一才可以。),然后可以点save,保存成为arff格式。2、若是打开csv格式文件的话,第一行要一定要定义如图命名每一列的属性名称(随便命名比如图中的1 2 3 4 5 6 7 89或者a b c d e f g之类的,但列之间不能重复)。分原创 2016-08-29 12:51:48 · 739 阅读 · 0 评论 -
深度学习keras程序失败的解决办法
首先,不要用pip install keras。 因为那个版本太老,经常各种bug。如果说使用了pip installkeras,那么就会自动引用安装到python27下面lib文件里面的库了,这样不管怎么改下载下来的文件都没有用。所以直接到https://github.com/ogrisel/keras 上面下载下来。然后运行example文件夹下面的例子。比如要使用imdb_l原创 2016-08-29 12:51:51 · 6746 阅读 · 0 评论