![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
machine learning
ericxk
这个作者很懒,什么都没留下…
展开
-
cross validation交叉验证
参考:http://blog.sina.com.cn/s/blog_49c7131d0100s7lc.html http://blog.sina.com.cn/s/blog_688077cf0100zqpj.html 交叉验证常见三种方式:1.Hold-Out Method原始数据分成两组,一组训练集,一组验证集,利用训练集训练分类器,验证集验原创 2014-09-16 10:06:01 · 1195 阅读 · 0 评论 -
20160620卷积神经网络.md
预备知识:前向神经网络和BP训练算法。 cnn目前主要应用在图像领域,它的网络结构相对于普通的神经网络来说,有了卷积层以及参数共享机制使得参数数量大大减少。 1. CNN结构先来个图吧! 1.1 数据输入层DATA上图没画出来,这个是放在最前做的,毕竟是数据输入层嘛! 一般数据输入层需要可以进行以下操作: 去均值(cnn只做这个,把train data各个维度中心化到0,注意test dat原创 2016-06-20 00:38:06 · 837 阅读 · 0 评论 -
20160303线性模型.md
tips:注意下文中上下标的关系,当同时上下标出现,下标表示第几个样本,上标表示第几维特征。具体情况,具体分析。1 线性模型线性模型是机器学习模型中最基本的模型。许多强大的非线性模型都是在线性模型之上构建的。 给定一个有d个属性的样本x,x=(x^1,x^2,x^3,…,x^d),其中x^i为x在第i个属性上的取值,则线性模型就是通过将各个属性线性组合在一起的达到预测目的的函数。 f(x)=∑i原创 2016-03-06 11:56:37 · 711 阅读 · 0 评论 -
20151227感知机(perceptron).md
1 感知机1.1 感知机定义感知机是一个二分类的线性分类模型,其生成一个分离超平面将实例的特征向量,输出为+1,-1。导入基于误分类的损失函数,利用梯度下降法对损失函数极小化,从而求得此超平面,该算法有原始形式和对偶形式。 定义:假设输入空间是χ⊆ℝn\chi \subseteq \mathbb{R}^n,输出空间是{+1,-1},输入x∈χx \in \chi 表示实例的特征向量,对应于输入空原创 2015-12-30 00:11:35 · 441 阅读 · 0 评论 -
20150916谱聚类.md
#1.谱聚类概念##1.1基本概念1. 实对称阵的特征值是实数2. 实对称阵不同特征值对应的特征向量正交3. **谱**:方阵作为线性算子,它的所有特征值的全体统称方阵的谱。4. **谱半径**:方阵的谱半径为最大的特征值,矩阵A的谱半径为$\left( A^T A \right)$的最大特征值5. **谱聚类**:一般来说,是一种基于图论的聚类方法,通过对样本数据的拉普拉斯矩阵的特征向量进行聚类,从而原创 2015-09-20 15:18:48 · 583 阅读 · 1 评论 -
20150916谱聚类.md(图片版)
原创 2015-12-28 23:12:15 · 445 阅读 · 0 评论 -
20150915密度聚类.md
1. 密度聚类思想密度聚类思想是,只要一个区域中的点的密度大于某个阈值,就把他加到与之相近的聚类中去。 优点:能对任意形状聚类,对噪声不敏感。 缺点:计算密度单元的复杂度大,可以提前建立空间索引降低计算量。2. DBSCAN算法DBSCAN(Density-Based Spatial Clustering of Applications with Noise)将簇定义为密度相连的点的最大集合,能原创 2015-09-23 16:04:56 · 1319 阅读 · 0 评论 -
20151007kaggle Titanic心得.md
Titanic是kaggle上一个练手的比赛,kaggle平台提供一部分人的特征,以及是否遇难,目的是预测另一部分人是否遇难。目前抽工作之余,断断续续弄了点,成绩为0.79426。 在这个比赛过程中,接触并了解了一些数据挖掘比赛的基本流程,现记录一下。1. 分析数据因为数据量比较小,train有800多条数据,test有400多条数据,因此这里用了execl的数据透视表分析。同时python提原创 2015-10-07 22:50:34 · 7342 阅读 · 0 评论 -
20150913K-means聚类.md
1. 聚类的思想:将一个有N个对象的数据集,构造成k(k<=n)个划分,每个划分代表一个簇。使得每个簇包含一个对象,每个对象有且仅属于一个簇。 对于给定的k,算法首先给出一个初始的划分方法,以后通过反复迭代的方法改变划分,使得每一次改进之后的划分方案都较前一次更好。2. K-means聚类2.1K-means聚类的思想K-means算法使用广泛,有时候也作为其他聚类算法的基础。 算法首先随机选择原创 2015-09-15 13:52:17 · 738 阅读 · 0 评论 -
20150926 kaggle Titanic入门篇excel&python.md
1 excel数据透视表这里主要是讲述了一下插入里面的数据透视表常用功能,数据透视表十分方便,比直接筛选还要简单,看数据很直观,这里大力推荐。2 python&pandas这里主要是讲述了pandas的一些基本用法,直接上代码吧。2.1 pandas dataframe文章所述pandas和R语言一样有dataframe,对于分析处理数据十分方便。import pandas as pdimport原创 2015-09-26 22:16:29 · 820 阅读 · 0 评论 -
20150824朴素贝叶斯.md
核心就是贝叶斯公式: p(x|y) = p(x,y)/p(y) = p(y|x)p(x)/p(y)原创 2015-08-24 23:31:26 · 635 阅读 · 0 评论 -
20160512关于mac安装caffe的记录.md
记得2015年在mac系统上安装过一次caffe,非常顺利,但是最近群里许多同学反映mac安装caffe出现了各种问题,同时我也在帮助别人安装caffe的时候也遇到了一些坑,不再像以前这么顺利了。估计与操作系统,caffe升级有关。 今晚我重新装了一遍caffe,记录下了整个安装过程,希望对各位同学有用。 mac os 版本:10.11.4 xcode 版本: 7.21. 安装Homebrew原创 2016-05-12 22:32:10 · 7844 阅读 · 13 评论