Machine Learning
文章平均质量分 77
Joy_Shen
You are in the picture
展开
-
奇异值分解(SVD)和图像矩阵的分解测试
在很多情况下,数据的绝大部分信息往往集中在很小一部分数据上,我们知道线性代数中有很多矩阵的分解技术可以将矩阵表示成易于处理或是表达简化的形式。最常见的一就种是SVD(Singular Value Decomposition)算法。原创 2017-06-20 16:57:34 · 12589 阅读 · 0 评论 -
机器学习中的precision, recall, accuracy, F值
假设用机器学习方法解决某个二元分类问题,在分析比较不同模型时常看到这些指标。四个概念:TP,FP,TN,FNTP(True Positive):在判定为positive的样本中,判断正确的数目。FP(False Positive):在判定为positive的样本中,判断错误的数目。TN(True Negative):在判定为negative的样本中,判断正确的数目。FN(Fal原创 2018-01-16 19:48:45 · 45955 阅读 · 13 评论 -
树回归:CART算法构建回归树和模型树(代码笔记)
分类回归树(Classification And Regression Trees,CART)是一种构造树的监督学习方法。笔记实现了回归树和模型树。原创 2017-11-09 10:54:47 · 3730 阅读 · 0 评论 -
标准回归:预测数值型数据
回归和分类的不同,在于它的目标变量是连续数值型。它也是一种监督学习方法。笔记中实现的有基本线性回归,局部加权线性回归,岭回归。原创 2017-11-09 10:52:22 · 720 阅读 · 0 评论 -
利用AdaBoost元算法的分类器(代码笔记)
将不用的分类器组合起来的方法称为集成方法(ensemble method)或元算法(meta-algorithm),AdaBoost就是一种集成方法。笔记实现了基于单层决策树的AdaBoost分类器。原创 2017-11-09 10:51:58 · 782 阅读 · 0 评论 -
使用Logistic回归进行分类(代码笔记)
基于Sigmoid函数和Logistic的分类,使用梯度上升找到最优回归系数,相当于找到决策边界。再用数据特征和Logistic回归就能算出分类。原创 2017-11-09 10:51:29 · 2194 阅读 · 0 评论 -
ID3构造决策树预测隐形眼镜类型(代码笔记)
决策树可以从数据集合中提取出一系列规则,从而分类样本。它的优势是能理解数据蕴含信息。原创 2017-11-09 10:51:08 · 1230 阅读 · 0 评论 -
kNN算法识别手写数字(代码笔记)
k邻近算法,有监督的分类算法。思想:利用输入数据特征值和训练样本数据特征值之间的距离分类,挑出距离最小的k个训练样本的类别频率,作为预测的分类估计。python代码实现。原创 2017-11-09 10:50:32 · 688 阅读 · 0 评论 -
卷积神经网络做图像风格迁移的项目代码笔记
算法来源 CVPR 2016 的文章 “Image Style Transfer Using Convolutional Neural Networks”。主要是利用一个已经在ImageNet 上训练好的卷积神经网络 VGG-19。有代码参考和理解笔记。原创 2017-10-18 20:55:37 · 5823 阅读 · 16 评论 -
机器学习中的标准化/归一化
数据的标准化是将数据按比例缩放,使之落入一个小的特定区间。在一些数据比较和评价中常用到。典型的有归一化方法。归一化方法的主要有两种形式:一种是把数变为(0,1)之间的小数,一种是把有量纲表达式变为无量纲表达式。笔记的目的是弄清概念,和python的实现。原创 2017-09-20 20:20:35 · 12226 阅读 · 0 评论 -
离散Hopfield神经网络的联想记忆
内容:构建离散Hopfield神经网络,存储记忆5x7点阵的大写字母,讨论在不同存储容量和噪声的情况下的联想恢复性能。要求:1.讨论网络存储分别为15,25个字符的情况下,字符联想恢复效果。2.讨论网络存储分别为15,25个字符的情况下,增加噪声字符的联想恢复效果。原创 2017-07-12 16:19:46 · 2928 阅读 · 0 评论 -
K-means空间聚类分析
内容:根据项目给出的高维空间坐标数据,用K-means做聚类分析。原创 2017-07-12 17:06:47 · 6667 阅读 · 6 评论 -
机器学习之scikit-learn初识
上了一门机器学习课,实践平台老师推荐了Python和scikit-learn库。scikit-learn库包含有完善的文档和丰富的机器学习算法,在官方文档上每种算法都有讲解和应用示例(简直堪比老师课上的PPT)。于是调查了一下这个库,目的是学习下它怎么用。原创 2017-06-26 17:56:29 · 2746 阅读 · 0 评论 -
点互信息(PMI)预测utterance关键词
PMI(Pointwise Mutual Information)机器学习相关文献中,可以看到使用PMI衡量两个变量之间的相关性,比如两个词,两个句子。原理公式为:在概率论中,如果x和y无关,p(x,y)=p(x)p(y);如果x和y越相关,p(x,y)和p(x)p(y)的比就越大。从后两个条件概率可能更好解释,在y出现的条件下x出现的概率除以单看x出现的概率,这个值越大表示x和y原创 2018-01-16 21:16:00 · 18341 阅读 · 6 评论