机器学习笔记汇总1

1. 机器学习基本类型 有监督学习: 根据已知的输入和输出,建立联系它们的模型,根据该模型对未知输出的输入进行判断。 1)回归:以无限连续域的形式表示输出 2)分类:以有限离散域的形式表示输出 无监督学习: 在一组没有已知输出(标签)的输入中,根据数据的内部特征和练习,...

2018-10-25 08:39:28

阅读数 138

评论数 0

分类问题:逻辑回归模型(1)

2018-10-25 08:38:32

阅读数 65

评论数 0

分类问题--逻辑回归模型(one-vs-all)(2)

2018-10-25 08:38:14

阅读数 374

评论数 0

逻辑回归基础和SVM基础

Logistic Regression Model是一种有监督学习方法,主要用于二元分类,也可以进行多远分类。其本质上是一种符合二项分布的线性回归模型(Linear Regression Model),不同之处就在于逻辑回归是将连续域的输出通过逻辑函数映射为离散域。 逻辑函数为s...

2018-10-25 08:37:13

阅读数 361

评论数 0

Bayes、KNN、PCA和异常检测基础

Bayes 已知样本的某些特性,求解该样本属于某个类别的后验概率P(Y|X=x) 先验概率、条件概率、后验概率 先验概率:是指根据以往经验和分析得到的概率. 后验概率:事情已经发生,要求这件事情发生的原因是由某个因素引起的可能性的大小 贝叶斯定理: P(A|B)...

2018-10-25 08:36:43

阅读数 936

评论数 0

boxcox变换python实现

boxcox1p变换参数lambda估算方法: 极大似然估计 或者 贝叶斯估计 (原理略) 极大似然估计: 设总体中含有待估参数theta, 可以取很多值。已知样本观察值,求使该样本值出现概率最大的theta值作为theta的估计值,称之为极大似然估计。 参考:极大似然估计思想的最简单...

2018-10-12 12:10:36

阅读数 3127

评论数 2

pandas基础属性方法随机整理(七):applymap, map, replace

pandas的DataFrame和Series分别有自己的矢量化函数 pandas.DataFrame.applymap() pandas.Series.map() 两个函数的params不同: map(self, arg, na_action=None):参数有三种类型选择 arg ...

2018-08-29 18:05:33

阅读数 277

评论数 0

机器学习sklearn利用GridSearchCV进行超参数优化后的SVM分类

# -*- coding: utf-8 -*- ''' SVM分类:最优超参数GridSearchCV优化后的SVM分类 ''' import numpy as np import sklearn.model_selection as ms import sklearn.svm as svm i...

2018-08-14 20:12:44

阅读数 1940

评论数 0

机器学习sklearn朴素贝叶斯分类器----工资收入等级评估

# -*- coding: utf-8 -*- """ Created on Wed Aug 1 14:54:59 2018 @author: Administrator "&amp...

2018-08-14 12:17:44

阅读数 118

评论数 0

机器学习sklearn模块(线性回归LinearRegression模型、岭回归Ridge模型、基于LinearRegression的多项式回归模型)

对比利用多项式定义进行多项式拟合:笔记代码:多项式拟合和极值点连接 线性回归 sklearn.linear_model.LinearRegression() --> return:线性回归器 ...

2018-08-13 16:03:01

阅读数 649

评论数 0

机器学习之数据预处理(均值移除、范围缩放、归一化、二值化、独热编码、标签编码)

# -*- coding: utf-8 -*- ''' 数据预处理: ''' import numpy as np import sklearn.preprocessing as sp import matplotlib.pyplot as plt # 数据源1 raw_samples =...

2018-08-13 14:00:38

阅读数 2294

评论数 1

Redis简明教程

Redis redis是完全开源免费的,遵守BSD协议,是一个高性能的key-value数据库 特点 Redis支持数据的持久化。` 可以将内存中的数据保存在磁盘中,重启的时候可以再次加载进行使用。 支持多种数据类型储存。 Redis不仅仅支持简单的key-va...

2018-08-11 10:28:35

阅读数 66

评论数 0

代码版本管理:Git日常使用指令

关于Git的几个概念 版本库(仓库):储存代码文件等的地方 本地仓库:本机仓库 远程仓库:充当‘中央服务器’,用于不同节点之间进行代码交换的地方 克隆:复制 分支branch:不同分支做不一样的事情,用于协同开发 标签:用于标注版本信息的‘指针’指向某一个commit位置 常用指令 ...

2018-08-10 23:16:36

阅读数 54

评论数 0

机器学习sklearn基础(2):基于KNN分类器的有监督分类模型 (数组去重方法np.unique()以及色级构建说明plt.get_cmap(..)(..))

# -*- coding: utf-8 -*- """ Created on Fri Aug 3 14:05:33 2018 @author: Administrator "&amp...

2018-08-06 19:53:58

阅读数 1076

评论数 0

matplotlib基础4:常见图形绘制(matplotlib.patches模块对象)

# -*- coding: utf-8 -*- ''' 绘制常见图形对象如:Rectangle, ellipse, circle, polygon... ''' import matplotlib.pyplot as plt import matplotlib.patches as mp pl...

2018-08-05 20:25:01

阅读数 2592

评论数 0

机器学习sklearn基础(1):多元逻辑回归分类器 (pcolormesh说明及绘图)

# -*- coding: utf-8 -*- ''' 多元分类:逻辑回归分类器 并绘制pcolormesh伪彩图 sklearn.linear_model.LogisticRegression( solver='liblinear', C=正则强度) ''' #...

2018-08-03 13:37:38

阅读数 1243

评论数 0

numpy基础属性方法随机整理(10):间接联合排序函数np.lexsort和复数直接排序函数np.sort_complex

间接联合排序函数:np.lexsort((scores, ages)) 复数直接排序函数:np.sort_complex(c).real 获取array数组的下标:np.where() 通过下标数组返回数组中的元素集:np.take() np.where(namesComplexSorte...

2018-07-30 13:05:38

阅读数 411

评论数 0

matplotlib基础3:散点图scatter图形和polar坐标图绘制及方法属性简述(希腊字母表示方法 r'$ name_ $')

1、散点图scatter: NOTE: plt.scatter(… c=d, cmap='bwr_r'…) c=d, cmap='jet': 渐变颜色映射 cmap_list元素后面加'_r'表示逆向渐变,如 bwr蓝白红 ---&amp...

2018-07-28 15:42:58

阅读数 653

评论数 0

numpy基础属性方法随机整理(9):专用函数-- np.lexsort() / np.sort_complex两种方法实现间接联合排序

间接联合排序: 间接获取排序样本的下标 原始数列:8 2 3 1 7 4 6 5 9 直接排序:1 2 3 4 5 6 7 8 9 间接排序:3 1 2 5 7 6 4 0 8 (原始序列元素的下标) 姓名:张三 李四 王五 赵六 陈七 成绩:90 70 50 ...

2018-07-27 19:03:17

阅读数 453

评论数 0

python基础12:python矢量运算map函数和numpy矢量运算函数(np.vectorize(fun)(A, B) 和np.frompyfunc(chu,2,1)(a, b))

NOTE: 1)numpy中几乎所有的算术和关系运算符都被numpy借助ufunc实现为可对数组 操作的矢量化运算符.如np.array, np.mat都可以自动进行矢量化运算 2)对list等不能直接进行矢量化运算的数据类型而言,可采用numpy的矢量化函数 list的两种矢量化...

2018-07-27 17:20:10

阅读数 762

评论数 0

提示
确定要删除当前文章?
取消 删除