- 博客(12)
- 资源 (20)
- 收藏
- 关注
原创 机器学习之特征工程
本文是一篇关于特征工程的总结类文章,如有不足之处或理解有偏差的地方,还望大家多多指点。首先,给一张特征工程的思维导图: 【如果要浏览图片,建议将其下载到本地,使用图片浏览软件查看】 关于特征工程(Feature Engineering),已经是很古老很常见的话题了,坊间常说:“数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已”。由此可见,特征工程在机器学习中占有相当重要的地位
2015-10-25 12:49:28 37288 7
原创 Scikit-learn Preprocessing 预处理
本文主要是对照scikit-learn的preprocessing章节结合代码简单的回顾下预处理技术的几种方法,主要包括标准化、数据最大最小缩放处理、正则化、特征二值化和数据缺失值处理。内容比较简单,仅供参考!首先来回顾一下下面要用到的基本知识。一、知识回顾均值公式:x¯=1nΣ_i=1nxi\bar{x}=\frac{1}{n}\Sigma\_{i=1}^{n}x_{i}方差公式:s2=1nΣ_i
2015-10-25 20:50:05 47205 7
原创 Windows下使用git push命令的无密码设置
在使用git时,每次进行git push时都需要输入用户名和密码,简直让人抓狂呀。下面介绍一种方法,可以避免用户名和密码输入,节省大量时间。1.添加环境变量首先在系统变量中添加一个环境变量HOME,内容为HOME%USERPROFILE% 2.新建配置文件由于使用的是Windows,所以进入%HOME%目录(如我的:C:\Users\username),新建一个名为”_netrc”的文件,文件
2015-10-22 16:46:40 2523
原创 Spring+SpringMVC+Mybatis整合系列(三)SSM框架整合
项目源码Github:https://github.com/csuldw/SSM_OEP通过前面两个博文[ Spring+SpringMVC+Mybatis整合系列(一)Maven安装和Eclipse配置](http://blog.csdn.net/dream_angel_z/article/details/49095539) 和 [Spring+SpringMVC+Mybatis整合系列(二)Eclipse新建
2015-10-13 14:40:03 6929 5
原创 Spring+SpringMVC+Mybatis整合系列(二)Eclipse新建Maven web项目
这是SSM搭建的第二篇,关于eclipse集成Maven的部分已经在上一篇中 Spring+SpringMVC+Mybatis整合系列(一)Maven安装和Eclipse配置详细介绍完,下面主要介绍使用eclipse新建Maven项目,以及创建完后的相关BUG的处理。
2015-10-13 14:10:25 3045
原创 Spring+SpringMVC+Mybatis整合系列(一)Maven安装与配置
最近有项目要做,想着还是来写一篇SSM搭建的文档吧!此搭建文档仅供参考!Spring+SpringMVC+Mybatis简称SSM,首先说明一下,由于搭建SSM的篇幅略长,如果放到一篇博文中,可能会给读者感觉阅读起来很吃力。其实,写博文也需要解耦,长篇大论并不是我的作风。这篇文章主要讲解搭建SSM所需要的初始环境,适合新手。下面来介绍下SSM搭建的初始环
2015-10-13 14:09:39 3060
原创 机器学习-牛顿方法&指数分布族&GLM
回头再温习一下Andrew Ng的机器学习视频课,顺便把没写完的笔记写完。本节内容牛顿方法指数分布族广义线性模型之前学习了梯度下降方法,关于梯度下降(gradient descent),这里简单的回顾下【参考感知机学习部分提到的梯度下降(gradient descent)】。在最小化损失函数时,采用的就是梯度下降的方法逐步逼近最优解,规则为θ:=θ−η∇θℓ(θ)\theta := \the
2015-10-06 13:31:26 11562 3
原创 机器学习-感知机perceptron
在机器学习中,感知机(perceptron)是二分类的线性分类模型,属于监督学习算法。输入为实例的特征向量,输出为实例的类别(取+1和-1)。感知机对应于输入空间中将实例划分为两类的分离超平面。感知机旨在求出该超平面,为求得超平面导入了基于误分类的损失函数,利用梯度下降法 对损失函数进行最优化(最优化)。感知机的学习算法具有简单而易于实现的优点,分为原始形式和对偶形式。感知机预测是用学习得到的感知机
2015-10-05 18:28:19 50253 15
原创 机器学习—过拟合overfitting
今天在知乎上看到一个问题:人脑有海量的神经元(参数),为什么没有过拟合?面对各个网友的回答,突然发现自己对于过拟合的概念似乎理解的不是很透彻,或者说之前就没有完全理解透。其中有个人这么说“样本少feature多才overfitting”也有人提到看红框标注部分,也就是说样本多就不会发生过拟合么。先不管知乎这个问题了,为了搞清过拟合的概念,再次跑到wikipedia去搜寻答案。下面是wikipedia
2015-10-04 20:31:30 16431 1
原创 机器学习算法-K最近邻从原理到实现(Python)
引文:决策树和基于规则的分类器都是积极学习方法(eager learner)的例子,因为一旦训练数据可用,他们就开始学习从输入属性到类标号的映射模型。一个相反的策略是推迟对训练数据的建模,直到需要分类测试样例时再进行。采用这种策略的技术被称为消极学习法(lazy learner)。最近邻分类器就是这样的一种方法。1.K最近邻分类器原理首先给出一张图,根据这张图来理解最近邻分类器,如下:
2015-10-04 17:20:16 11732
原创 Python加载csv文件的两种方式
数据集以kaggle的Digit Recognizer的train.csv文件为例,数据截图如下:说明,csv文件中每行数据的每个特征列都是用逗号“,”隔开。该CSV文件中除了保存数值外,还有一些属性值,如第一行以及第一列的label标签。所以在处理是需要进行相应的处理。下面介绍下两种加载这种csv文件的方法方法一:使用Python的csv模块csv模块中的函数reader(csvfile, dia
2015-10-04 15:07:53 47858 1
visio_2010_64位.part3.rar
2018-04-29
visio 2010 64 bit-part2
2018-04-29
visio 2010 64 bit-part1
2018-04-29
visio 2010 64 bit-part4
2018-04-29
决策树算法python实现
2015-05-25
python2.7.5安装及其相应的matplotlib的包及依赖
2015-05-25
jQuery+Struts+Ajax无刷新分页
2015-04-13
jasperreports-5.5.1_struts2.3整合用到的jar包
2014-05-28
php-5.3.6-Win32-VC9-x64.zip
2014-03-18
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人