自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 机器学习——正则化

为了增加模型的泛化能力,避免模型出现过拟合的现象,我们经常会加入正则化处理(当模型偏差较低,但是方差很大,尤其在输入的维数较高时,很容易出现过拟合现象,当加入正则项,模型损失了一部分偏差,却大大降低了模型的方差)。L1和L2正则是我们经常用到的方法。L1正则:这种方法的结果会让参数向量中许多元素趋于0,使得大部分特征失去优化目标函数的贡献。这种方法让有效特征变得稀疏的L1正则化模型,通常称

2016-11-28 16:05:34 549

原创 scikit learning——交叉验证

import numpy as npfrom sklearn import datasetsfrom sklearn.cross_validation import train_test_splitfrom sklearn.neighbors import KNeighborsClassifieriris = datasets.load_iris()iris_X =iris.datai

2016-11-09 16:52:50 492

原创 scikit learn标准化数据

from sklearn import preprocessingimport numpy as npa=np.array([[10,2.7,3.6], [-100,5,-2], [120,20,40]],dtype=np.float64)print(a)print(preprocessing.scale(a))#正则化数据运行结果,正则前和正则

2016-11-09 15:38:32 573

原创 scikit learn——模型属性和功能

from sklearn import datasetsfrom sklearn import linear_modelimport matplotlib.pyplot as plt#==============================================================================# 用线性回归做导入数据的小例子#======

2016-11-09 14:28:34 301

原创 scikit learn导入datasets和新建datasets

from sklearn import datasetsfrom sklearn import linear_modelimport matplotlib.pyplot as plt#==============================================================================# 用线性回归做导入数据的小例子#======

2016-11-09 13:54:25 1840

原创 window下spyder的快捷键

块注释/块反注释 Ctrl + 4/5 断点设置 F12 关闭所有 Ctrl + Shift + W 代码完成 Ctrl +空格键 条件断点 SHIFT + F12 配置 F6 复制 Ctrl + C 向下复制 Ctrl + Alt +向下 剪切 Ctrl + X 调试 Ctrl + F5键 删除 Del 向上复制 Ctrl + Alt +向上 粘贴

2016-11-09 13:28:38 3454

原创 scikit learning——用k邻近算法进行分类实例

这次是一个简单的scikit learn的简单应用,分类器用的是knn分类器,数据集是sklearn自带的莺尾花的数据集,将数据集分成7:3的比例,70%的数据用来训练knn分类器,剩下的30%进行测试import numpy as npfrom sklearn import datasetsfrom sklearn.cross_validation import train_test_s

2016-11-09 12:36:48 331

原创 Scikit Learn简介

一般来说,机器学习问题可以这样来理解:我们有n个 样本 (sample)的数据集,想要预测未知数据的属性。如果描述每个样本的数字不只一个,比如一个多维的条目(也叫做 多变量数据 (multivariate data)),那么这个样本就有多个属性或者 特征 。我们可以将机器学习问题分为两大类——监督学习(supervise learning)和无监督学习(unsupervise

2016-11-09 09:59:55 595

原创 加速神经网络训练

前言这里讨论的优化问题指的是,给定目标函数f(x),我们需要找到一组参数x,使得f(x)的值最小。本文以下内容假设读者已经了解机器学习基本知识,和梯度下降的原理。SGDSGD指stochastic gradient descent,即随机梯度下降。是梯度下降的batch版本。对于训练数据集,我们首先将其分成n个batch,每个batch包含m个样本。我们每次

2016-11-08 15:09:41 707

原创 Jupyter Notebook 快速入门(下)

这两天分享的 Jupyter Notebook 快速入门文章,比较基础,只涉及了基本功能介绍和演示。后面再找机会分享其他高级用法。从上一篇文章中,我们发现 Jupyter notebook 的基本功能就可以支持完成许多事情。不过它背后的功能和选项并不止于此。本文将进一步介绍一些有用的操作。单元格操作高级单元格操作,将让编写 notebook 变得更加方便。举例如下:

2016-11-07 17:50:55 8544

原创 Jupyter Notebook 快速入门(上)

本文作者为 Marin Gilles ,他是来自法国的一位物理学博士生,用 Python 开发了自己的物理学模拟框架。本文分为两部分,是 Python 翻译组 成立后的第一篇译文,译者EarlGrey。Jupyter Notebook(此前被称为 IPython notebook)是一个交互式笔记本,支持运行 40 多种编程语言。在本文中,我们将介绍 Jupyter noteboo

2016-11-07 17:49:33 13237

转载 Numpy 入门教程(1)

翻译自官方文档Tentative NumPy Tutorial,有删节。Numpy 入门教程NumPy 提供了对多维数组的支持,与Python原生支持的List类型不同,数组的所有元素必须同样的类型。数组的维度被称为axes,维数称为 rank。 Numpy的数组类型为 ndarray, ndarray 的重要属性包括: ndarray.ndim:数组的维数,也称为

2016-11-06 22:00:17 303

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除