机器学习
文章平均质量分 69
SDUT_wdc
这个作者很懒,什么都没留下…
展开
-
通俗易懂讲解SVM
(一)SVM的八股简介支持向量机(Support Vector Machine)是Cortes和Vapnik于1995年首先提出的,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中[10]。支持向量机方法是建立在统计学习理论的VC 维理论和结构风险最小原理基础上的,根据有限的样本信息在模型的复杂性(即对特定训练样本的学习精度,Accu转载 2016-03-20 21:35:12 · 1507 阅读 · 0 评论 -
sklearn数据标准化
#encoding:utf-8 ''''' Created on 2015年10月13日 @author: ZHOUMEIXU204 ''' #sklearn数据标准化,数据标准化有三种 #第一种是Z-Score,或者去除均值和方差缩放 from sklearn import preprocessing import numpy as np转载 2017-03-17 09:03:57 · 1481 阅读 · 0 评论 -
centos 安装TensorFlow
1.安装python2.7下载Python-2.7.5.tar.gz文件,tar -xzvf python-2.7.5.tar.gzcd python-2.7.5./configure --prefix=/usr/local/python2.7 --enable-unicode=ucs4make && make install建立软连接,使转载 2017-03-18 23:05:17 · 1006 阅读 · 0 评论 -
分类器的性能度量
一. 评估方法1.留出法 “留出法”直接将数据集D划分为两个互斥的集合,其中一个集合作为训练集S,另一个作为测试机T,在S上训练处模型后,用T来评估其测试误差,作为对泛化误差的估计。2.交叉验证法 “交叉验证法”先将数据集D划分为k个大小相似的互斥子集,每个子集都尽可能保持数据分布的一致性,即从D中通过分层采样得到,然后每次用k-1个子集的并集作为训练集,余下的那个子原创 2017-02-13 10:44:21 · 1052 阅读 · 0 评论 -
通俗易懂讲解贝叶斯
0. 前言这是一篇关于贝叶斯方法的科普文,我会尽量少用公式,多用平白的语言叙述,多举实际例子。更严格的公式和计算我会在相应的地方注明参考资料。贝叶斯方法被证明是非常 general 且强大的推理框架,文中你会看到很多有趣的应用。1. 历史托马斯·贝叶斯(Thomas Bayes)同学的详细生平在这里。以下摘一段 wikipedia 上的简介:所谓的贝叶斯方法源于他生前为解决一个转载 2016-03-20 21:34:14 · 46742 阅读 · 9 评论 -
基于朴素贝叶斯的文本分类器
如果别人给你推荐一篇文章,只给你说了文章名字,那么你现在最好奇的应该是:这文章是什么类型的??类型直接决定了你会不会去看,还有就是如果别人给你说这文章是情感类的,听完你也许比较感兴趣但读完后发现这文章是军事类的,那么你会很不爽,多影响情绪,所以文章的所属类型还是必须要很准确的。像我之前实习的一家公司就是给人推送广告的,公司强调精准,意思很明了就是要把广告推送给可能会需要广告中所推产品的人们,我们技原创 2016-06-24 17:03:39 · 1517 阅读 · 2 评论 -
线性回归及梯度下降
本文会讲到:(1)线性回归的定义(2)单变量线性回归(3)cost function:评价线性回归是否拟合训练集的方法(4)梯度下降:解决线性回归的方法之一(5)feature scaling:加快梯度下降执行速度的方法(6)多变量线性回归Linear Regression 注意一句话:多变量线性回归之前必须要Feature Scaling转载 2016-12-10 16:15:29 · 470 阅读 · 0 评论 -
Kaggle入门——使用scikit-learn解决DigitRecognition问题
Kaggle入门——使用scikit-learn解决DigitRecognition问题@author: wepon@blog: http://blog.csdn.net/u0121626131、scikit-learn简介scikit-learn是一个基于NumPy、SciPy、Matplotlib的开源机器学习工具包,采用Python语言编写,主转载 2016-12-23 17:25:19 · 733 阅读 · 0 评论 -
PCA的数学原理
PCA(Principal Component Analysis)是一种常用的数据分析方法。PCA通过线性变换将原始数据变换为一组各维度线性无关的表示,可用于提取数据的主要特征分量,常用于高维数据的降维。网上关于PCA的文章有很多,但是大多数只描述了PCA的分析过程,而没有讲述其中的原理。这篇文章的目的是介绍PCA的基本数学原理,帮助读者了解PCA的工作机制是什么。当然我并不打算把文章写成原创 2016-04-21 18:55:17 · 1664 阅读 · 0 评论 -
sklearn 数据缺失值处理
关于缺失值(missing value)的处理在sklearn的preprocessing包中包含了对数据集中缺失值的处理,主要是应用Imputer类进行处理。首先需要说明的是,numpy的数组中可以使用np.nan/np.NaN(Not A Number)来代替缺失值,对于数组中是否存在nan可以使用np.isnan()来判定。使用type(np.nan)或者type(n转载 2017-03-17 09:05:33 · 2846 阅读 · 0 评论