机器学习
呜哈哈哈
哈哈哈
展开
-
Rosenblatt感知器
感知器是最简单的神经网络,是第一个从算法上描述的神经网络。由心理学家Rosenblatt于1958提出。感知器是用于线型可分模式分类的最简单的模型。这是一个经典的感知器模型,包括n个输入、n个权值,被称作突触权(synaptic weights),还有阈值(threshold)w0,在他们相加就和后,设置一个阈值,据此进行分类。我们称带有Hard Limiter的神经元为M原创 2015-11-16 19:56:57 · 3406 阅读 · 0 评论 -
PCA主成因分析法
PCA算法的最终目标是把高维数据进行降维。之所以要降维,是因为数据在低维空间中处理起来更简单。可以用一个最简单的例子来说明降维,在三维空间中有一个球,我们可能希望研究一下球的几何性质,这个时候希望把它画在纸上(二维平面),那么怎么把它投影(project)到二维平面上就是一个降维的过程。这里的关键在于你投到二维平面上时,要看起来仍然要和原来在三维空间中的那个球达到最大相似,你不能把一个球经过降维之原创 2015-11-22 18:28:22 · 1220 阅读 · 0 评论 -
K-means聚类算法
K-means算法是聚类算法中最简单的一种。聚类指的就是将一堆具有类似特征的无标签点归位一类,比如黑种人和黄种人由于身高、体型、肤色、毛发各个特征上的不同(单纯肤色说服力不够)而聚类为两个簇。K-means算法通过迭代优化将样本聚类成k个簇。算法流程:1、任取k个质心2、求出每个样本到每个质心的距离,并将其归至距离最近的簇。3、根据上一步归类的样本,重新计算质心(各项特征的原创 2015-11-01 19:19:12 · 1021 阅读 · 0 评论 -
机器学习——交叉验证与特征选择
k-折叠交叉验证是一种在机器学习中很常用的方法,简单来说就是手头有是10个数据,取2-10为样本数据,用来学习,生成公式后将第一个数据送入公式进行计算,下次则选取第二个数据作为测试数据,1,3-10这九个数据作为样本数据进行学习,如此计算。如此循环十次,可以得到一个错误率,用以判定学习的结果怎么样。 k指的是将你的数据分为k份,进行k次循环,上面的例子的k就是10。如果每一个样例都做测试, 这原创 2015-11-01 18:53:42 · 7270 阅读 · 0 评论