机器学习
煲饭酱
数据进阶路上的煲饭酱,和他背着的用来讨饭的锅
展开
-
机器学习之数据预处理(均值移除、范围缩放、归一化、二值化、独热编码、标签编码)
# -*- coding: utf-8 -*-'''数据预处理:'''import numpy as npimport sklearn.preprocessing as spimport matplotlib.pyplot as plt# 数据源1raw_samples = np.array([ [3, -1.5, 2, -5.4], [0,...原创 2018-08-13 14:00:38 · 6507 阅读 · 2 评论 -
机器学习sklearn支持向量机分类 ---- 预测事件是否发生(event / nonevent)
# -*- coding: utf-8 -*-"""Created on Wed Aug 1 16:23:11 2018@author: Administrator"""'''SVM应用案例:分类'''import numpy as npimport sklearn.preprocessing as spimport sklearn.model_selection as ..原创 2020-02-25 23:02:11 · 151 阅读 · 0 评论 -
机器学习sklearn基础(1):多元逻辑回归分类器 (pcolormesh说明及绘图)
# -*- coding: utf-8 -*-'''多元分类:逻辑回归分类器 并绘制pcolormesh伪彩图sklearn.linear_model.LogisticRegression( solver='liblinear', C=正则强度)'''# pcolormesh(x, y, c=d, cmap='jet') cmap:渐变色映射plt....原创 2018-08-03 13:37:38 · 3939 阅读 · 0 评论 -
boxcox变换python实现
boxcox1p变换参数lambda估算方法:极大似然估计 或者 贝叶斯估计 (原理略)极大似然估计:设总体中含有待估参数theta, 可以取很多值。已知样本观察值,求使该样本值出现概率最大的theta值作为theta的估计值,称之为极大似然估计。参考:极大似然估计思想的最简单解释python代码:for i,lam in enumerate(lam_range): llf...原创 2018-10-12 12:10:36 · 18149 阅读 · 5 评论 -
机器学习笔记汇总1
1. 机器学习基本类型有监督学习:根据已知的输入和输出,建立联系它们的模型,根据该模型对未知输出的输入进行判断。1)回归:以无限连续域的形式表示输出2)分类:以有限离散域的形式表示输出无监督学习:在一组没有已知输出(标签)的输入中,根据数据的内部特征和练习,找到某种规则,进行族群的划分— 聚类半监督学习:从一个相对有限的已知结构中利用有监督学习的方法,构建基本模型,通过...原创 2018-10-25 08:39:28 · 362 阅读 · 0 评论 -
分类问题--逻辑回归模型(one-vs-all)(2)
原创 2018-10-25 08:38:14 · 1824 阅读 · 0 评论 -
分类问题:逻辑回归模型(1)
原创 2018-10-25 08:38:32 · 185 阅读 · 0 评论 -
逻辑回归基础和SVM基础
Logistic Regression Model是一种有监督学习方法,主要用于二元分类,也可以进行多远分类。其本质上是一种符合二项分布的线性回归模型(Linear Regression Model),不同之处就在于逻辑回归是将连续域的输出通过逻辑函数映射为离散域。逻辑函数为sigmoid函数,线性输出作为逻辑函数的输入,映射为[0,1]的离散域。当z趋于-∞时,结果趋于0;当z趋...原创 2018-10-25 08:37:13 · 592 阅读 · 0 评论 -
机器学习sklearn朴素贝叶斯分类器----工资收入等级评估
# -*- coding: utf-8 -*-"""Created on Wed Aug 1 14:54:59 2018@author: Administrator"""'''朴素贝叶斯分类器:预测工资收入等级'''import numpy as npimport sklearn.preprocessing as spimport sklearn.model_select..原创 2018-08-14 12:17:44 · 639 阅读 · 0 评论 -
机器学习sklearn模块(线性回归LinearRegression模型、岭回归Ridge模型、基于LinearRegression的多项式回归模型)
对比利用多项式定义进行多项式拟合:笔记代码:多项式拟合和极值点连接线性回归sklearn.linear_model.LinearRegression() --> return:线性回归器 线性回归器.fit(输入样本,输出标签) # 训练数据 线性回归器.predict(输入...原创 2018-08-13 16:03:01 · 4173 阅读 · 1 评论 -
机器学习sklearn基础(2):基于KNN分类器的有监督分类模型 (数组去重方法np.unique()以及色级构建说明plt.get_cmap(..)(..))
# -*- coding: utf-8 -*-"""Created on Fri Aug 3 14:05:33 2018@author: Administrator"""'''基于KNN的有监督分类'''import numpy as npimport sklearn.neighbors as snimport matplotlib.pyplot as plttrai..原创 2018-08-06 19:53:58 · 2551 阅读 · 0 评论 -
机器学习sklearn管线Pipeline, 样本生成器,特征选择器
# -*- coding: utf-8 -*-"""Created on Fri Aug 3 10:04:14 2018@author: Administrator"""import numpy as npimport sklearn.datasets as sdimport sklearn.feature_selection as fsimport sklearn.ense...原创 2020-02-25 23:03:17 · 228 阅读 · 0 评论 -
机器学习sklearn利用GridSearchCV进行超参数优化后的SVM分类
# -*- coding: utf-8 -*-'''SVM分类:最优超参数GridSearchCV优化后的SVM分类'''import numpy as npimport sklearn.model_selection as msimport sklearn.svm as svmimport sklearn.metrics as smimport matplotlib.pyplo...原创 2018-08-14 20:12:44 · 9083 阅读 · 1 评论 -
Bayes、KNN、PCA和异常检测基础
Bayes已知样本的某些特性,求解该样本属于某个类别的后验概率P(Y|X=x)先验概率、条件概率、后验概率先验概率:是指根据以往经验和分析得到的概率.后验概率:事情已经发生,要求这件事情发生的原因是由某个因素引起的可能性的大小贝叶斯定理:P(A|B)= P(A) * P(B|A) / P(B)理解:朴素贝叶斯是有训练数据学习联合概率分布P(X,Y),然后求得后验概率...原创 2018-10-25 08:36:43 · 2962 阅读 · 0 评论