2016年11月_panghaomingme

原创机器学习——正则化

为了增加模型的泛化能力，避免模型出现过拟合的现象，我们经常会加入正则化处理(当模型偏差较低，但是方差很大，尤其在输入的维数较高时，很容易出现过拟合现象，当加入正则项，模型损失了一部分偏差，却大大降低了模型的方差)。L1和L2正则是我们经常用到的方法。L1正则：这种方法的结果会让参数向量中许多元素趋于0，使得大部分特征失去优化目标函数的贡献。这种方法让有效特征变得稀疏的L1正则化模型，通常称

2016-11-28 16:05:34 549

原创 scikit learning——交叉验证

import numpy as npfrom sklearn import datasetsfrom sklearn.cross_validation import train_test_splitfrom sklearn.neighbors import KNeighborsClassifieriris = datasets.load_iris()iris_X =iris.datai

2016-11-09 16:52:50 492

原创 scikit learn标准化数据

from sklearn import preprocessingimport numpy as npa=np.array([[10,2.7,3.6], [-100,5,-2], [120,20,40]],dtype=np.float64)print(a)print(preprocessing.scale(a))#正则化数据运行结果，正则前和正则

2016-11-09 15:38:32 573

原创 scikit learn——模型属性和功能

from sklearn import datasetsfrom sklearn import linear_modelimport matplotlib.pyplot as plt#==============================================================================# 用线性回归做导入数据的小例子#======

2016-11-09 14:28:34 301

原创 scikit learn导入datasets和新建datasets

from sklearn import datasetsfrom sklearn import linear_modelimport matplotlib.pyplot as plt#==============================================================================# 用线性回归做导入数据的小例子#======

2016-11-09 13:54:25 1840

原创 window下spyder的快捷键

块注释/块反注释 Ctrl + 4/5 断点设置 F12 关闭所有 Ctrl + Shift + W 代码完成 Ctrl +空格键条件断点 SHIFT + F12 配置 F6 复制 Ctrl + C 向下复制 Ctrl + Alt +向下剪切 Ctrl + X 调试 Ctrl + F5键删除 Del 向上复制 Ctrl + Alt +向上粘贴

2016-11-09 13:28:38 3454

原创 scikit learning——用k邻近算法进行分类实例

这次是一个简单的scikit learn的简单应用，分类器用的是knn分类器，数据集是sklearn自带的莺尾花的数据集，将数据集分成7:3的比例，70%的数据用来训练knn分类器，剩下的30%进行测试import numpy as npfrom sklearn import datasetsfrom sklearn.cross_validation import train_test_s

2016-11-09 12:36:48 331

原创 Scikit Learn简介

一般来说，机器学习问题可以这样来理解：我们有n个样本 (sample)的数据集，想要预测未知数据的属性。如果描述每个样本的数字不只一个，比如一个多维的条目（也叫做多变量数据 (multivariate data)），那么这个样本就有多个属性或者特征。我们可以将机器学习问题分为两大类——监督学习（supervise learning）和无监督学习（unsupervise

2016-11-09 09:59:55 595

原创加速神经网络训练

前言这里讨论的优化问题指的是，给定目标函数f(x)，我们需要找到一组参数x，使得f(x)的值最小。本文以下内容假设读者已经了解机器学习基本知识，和梯度下降的原理。SGDSGD指stochastic gradient descent，即随机梯度下降。是梯度下降的batch版本。对于训练数据集，我们首先将其分成n个batch，每个batch包含m个样本。我们每次

2016-11-08 15:09:41 707

原创 Jupyter Notebook 快速入门（下）

这两天分享的 Jupyter Notebook 快速入门文章，比较基础，只涉及了基本功能介绍和演示。后面再找机会分享其他高级用法。从上一篇文章中，我们发现 Jupyter notebook 的基本功能就可以支持完成许多事情。不过它背后的功能和选项并不止于此。本文将进一步介绍一些有用的操作。单元格操作高级单元格操作，将让编写 notebook 变得更加方便。举例如下：

2016-11-07 17:50:55 8544

原创 Jupyter Notebook 快速入门（上）

本文作者为 Marin Gilles ，他是来自法国的一位物理学博士生，用 Python 开发了自己的物理学模拟框架。本文分为两部分，是 Python 翻译组成立后的第一篇译文，译者EarlGrey。Jupyter Notebook（此前被称为 IPython notebook）是一个交互式笔记本，支持运行 40 多种编程语言。在本文中，我们将介绍 Jupyter noteboo

2016-11-07 17:49:33 13237

转载 Numpy 入门教程（1）

翻译自官方文档Tentative NumPy Tutorial，有删节。Numpy 入门教程NumPy 提供了对多维数组的支持，与Python原生支持的List类型不同，数组的所有元素必须同样的类型。数组的维度被称为axes，维数称为 rank。 Numpy的数组类型为 ndarray， ndarray 的重要属性包括: ndarray.ndim：数组的维数，也称为

2016-11-06 22:00:17 303

panghaomingme的博客