- 博客(12)
- 资源 (9)
- 收藏
- 关注
原创 多元回归分析(multiple regression)及其应用
1. 与简单线性回归区别(simple linear regression) 多个自变量(x)2. 多元回归模型 y=β0+β1x1+β2x2+ … +βpxp+ε 其中:β0,β1,β2… βp是参数 ε是误差值3. 多元回归方程 E(y)=β0+β1x1+β2x2+ … +βpxp4. 估计
2017-10-06 22:14:25 62815
原创 简单线性回归及实现
0. 前提介绍:为什么需要统计量? 统计量:描述数据特征0.1 集中趋势衡量 0.1.1均值(平均数,平均值)(mean) graphic {6, 2, 9, 1, 2} (6 + 2 + 9 + 1 + 2) / 5 = 20 / 5 = 4 0.1.2中位数 (median): 将数据中的各个数值按照大小顺序排列,居
2017-10-06 22:01:43 646
转载 标签二值化LabelBinarizer
转载自:http://blog.sina.com.cn/s/blog_a6c646330102vx6y.html 对于标称型数据来说,preprocessing.LabelBinarizer是一个很好用的工具。比如可以把yes和no转化为0和1,或是把incident和normal转化为0和1。当然,对于两类以上的标签也是适用的。这里举一个简单的例子,说明将标签二值化以及其逆过程。# -*- c
2017-10-06 20:44:51 914
原创 神经网络算法(Nerual Networks)应用
1. 关于非线性转化方程(non-linear transformation function)sigmoid函数(S 曲线)用来作为activation function: 1.1 双曲函数(tanh) 1.2 逻辑函数(logistic function)2. 实现一个简单的神经网络算法# -*- coding:utf-8 -*-import numpy as np
2017-10-06 20:40:05 2717
原创 神经网络算法(Nerual Networks)
1. 背景: 1.1 以人脑中的神经网络为启发,历史上出现过很多不同版本 1.2 最著名的算法是1980年的 backpropagation 2. 多层向前神经网络(Multilayer Feed-Forward Neural Network) 2.1 Backpropagation被使用在多层向前神经网络上 2.2 多层向前神经网络由以下部分组成:
2017-10-06 16:24:58 773
原创 支持向量机(SVM)算法应用
第一个简单的小例子:# -*-coding:utf-8 -*-from sklearn import svmx = [[2, 0], [1, 1], [2, 3]]y = [0, 0, 1]clf = svm.SVC(kernel = 'linear')# kernel :核函数,默认是rbf,可以是‘linear’, ‘poly’, ‘rbf’, #‘sigmoid’, ‘precomput
2017-10-05 22:12:09 1611
原创 支持向量机(SVM)算法
1. 背景: 1.1 最早是由 Vladimir N. Vapnik 和 Alexey Ya. Chervonenkis 在1963年提出 1.2 目前的版本(soft margin)是由Corinna Cortes 和 Vapnik在1993年提出,并在1995年发表 1.3 深度学习(2012)出现之前,SVM被认为机器学习中近十几年来最成功,表现最好的算法.是最好的现成的分类器,‘现成’指
2017-10-05 16:00:53 1979
转载 python中的sort方法和sorted使用详解
Python中的sort()方法使用基础一、基本形式sorted(iterable[, cmp[, key[, reverse]]])iterable.sort(cmp[, key[, reverse]])参数解释: (1)iterable指定要排序的list或者iterable; (2)cmp为函数,指定排序时进行比较的函数,也就是用来排序的函数,可以指定一个函数或者lambda函数,如
2017-10-03 16:11:34 3875
原创 最邻近规则分类(K-Nearest Neighbor)KNN算法应用
最邻近规则分类(K-Nearest Neighbor)KNN算法应用1.Iris数据集介绍调用ython的机器学习库sklearn实现虹膜分类 Iris数据包含150条样本记录,分剐取自三种不同的鸢尾属植物setosa、versic010r和virginica的花朵样本,每一 类各50条记录,其中每条记录有4个属性:萼片长度(sepal length)、萼片宽度sepalwidth)、花瓣长
2017-10-03 15:13:14 750 1
原创 最邻近规则分类(K-Nearest Neighbor)KNN算法
最邻近规则分类(K-Nearest Neighbor)KNN算法1. 综述 1.1 Cover和Hart在1968年提出了最初的邻近算法 1.2 KNN是一种分类(classification)算法 1.3 输入基于实例的学习(instance-based learning), 懒惰学习(lazy learning)(因为KNN就是一种属于随大流的思想,我离那个部落近我就属于哪里的人)2. 例
2017-10-03 12:41:59 563
原创 scikit-learn实现决策树
Python机器学习的库:scikit-learn1.1: 特性: 简单高效的数据挖掘和机器学习分析 对所有用户开放,根据不同需求高度可重用性 基于Numpy, SciPy和matplotlib 开源,商用级别:获得 BSD许可1.2 覆盖问题领域: 分类(classification), 回归(regression), 聚类(clustering), 降维(dimension
2017-10-02 23:16:33 950
转载 python获取当前路径
转自:http://www.cnblogs.com/wind-wang/p/5822192.html import os,sys 使用sys.path[0]、sys.argv[0]、os.getcwd()/os.path.abspath(__file__)、os.path.realpath(__file__) sys.path是Python会去寻找模块的搜索路径列表,sys.path[0]和s
2017-10-02 18:41:48 2133
hadoop2.7.6-binaries.rar
2018-06-26
机器学习:实用案例解析(中文版,带完整书签)
2017-10-29
Python科学计算
2017-10-29
深度学习 DLbook_cn_public AI圣经 中文版电子书【完整版】
2017-10-29
android手机游戏源码
2013-06-24
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人