机器学习
bailixuance
拒绝拖延,做一个执行力强的人。
做好精力分配。
展开
-
逻辑回归算法推导及Python实现
写在前面:1、好多逻辑回归的算法推导要么直接省略,要么写的比较难以看懂,比如写成矩阵求导,繁难难懂,本文进行推导,会链式求导法则应当就能看懂2、本文参考若干文章,写在附注处,如果参考未写引用,还望提出2、本文后续可能不定时更新,如有错误,欢迎提出 一、最大似然估计(附1)Logistic Regression Classifier逻辑回归主要思想就是用最大似然概率方法构建出...原创 2018-10-24 20:57:23 · 2246 阅读 · 1 评论 -
机器学习实战----SKLearn实现SVM之minst分类
一、简介win10, python 3.6, notebook参考:【机器学习实战】支持向量机----分类库和简单训练mnisthttps://blog.csdn.net/u013597931/article/details/80076058SVM学习笔记(二)----手写数字识别https://blog.csdn.net/chunxiao2008/article/deta...原创 2018-12-17 20:25:04 · 4853 阅读 · 0 评论 -
python3.6 报错UnicodeDecodeError: 'ascii' codec can't decode byte 0x90 in position 614: ordinal not in
现象:f = gzip.open('MNIST_data/mnist.pkl.gz', 'rb')training_data, validation_data, test_data = cPickle.load(f)f.close()报错:UnicodeDecodeError Traceback (most recent call ...原创 2018-12-17 19:22:37 · 1233 阅读 · 0 评论 -
机器学习实战----SKLearn实现SVM
一、简介win10, notebook ,python 3.6 支持向量机总结我们在这里看到了支持向量机背后的原则的简单直观的介绍。这些方法是强大的分类方法,原因有很多:他们依赖相对较少的支持向量,意味着它们是非常紧凑的模型,并且占用很少的内存。 一旦训练了模型,预测阶段非常快。 因为它们仅受边缘附近的点的影响,它们适用于高维数据,甚至维度大于样本的数据,这对于其他算...原创 2018-12-16 21:29:40 · 1650 阅读 · 1 评论 -
机器学习实战——KNN
一、简介参考:https://blog.csdn.net/c406495762/article/details/75172850环境:win 10, notebook,python 3.6原blog较长,主要实现其算法,尽可能的简洁些,并对一些细节给出实例,如果熟练,细节处的函数尽可能的可以忽略,写出来主要是未来加强印象。三、四、五、三个实例,前两个同一种方法,分类函数是同一个...原创 2018-12-10 20:15:24 · 373 阅读 · 0 评论 -
机器学习实战----SVM
一、简介 参考:【分类战车SVM】第一话:开题话https://zhuanlan.zhihu.com/p/28046163支持向量机(SVM)——SMO算法https://zhuanlan.zhihu.com/p/32152421 优点: 小样本——SVM配备“支持向量”识别系统,精准打击 非线性——SVM嵌入了尖端前沿的“高维映射”技术。 ...原创 2018-12-15 21:43:23 · 1705 阅读 · 1 评论 -
机器学习实战----逻辑回归
一、简介:计算部分gradAscent()数据与标签均转换为numpy矩阵" * " : 矩阵相乘维度:数据:100行3列(添加了常数项) 标签:100行一列 初始权重:3行一列 每轮循环步骤:数据矩阵(100行3列) * 权重矩阵(3行一列),结果是100行一列 矩阵乘积(100行一列)代入 sigmoid()函数,结果是100行一列,即预测值 标签值(1...原创 2018-12-14 21:25:15 · 321 阅读 · 0 评论 -
机器学习实战----决策树
一、简介python3.6参考:Python3《机器学习实战》学习笔记(二):决策树基础篇之让我们从相亲说起https://blog.csdn.net/c406495762/article/details/75663451【机器学习】决策树(上)——从原理到算法实现https://blog.csdn.net/herosofearth/article/details/5234...原创 2018-12-14 16:45:59 · 527 阅读 · 0 评论 -
机器学习实战----朴素贝叶斯
一、简介win10, notebook ,python 3.6 朴素贝叶斯算法是有监督的学习算法,解决的是分类问题,如客户是否流失、是否值得投资、信用等级评定等多分类问题。优点: 简单易懂、学习效率高、在某些领域的分类问题中能够与决策树、神经网络相媲美。但由于该算法以自变量之间的独立(条件特征独立)性和连续变量的正态性假设为前提,就会导致算法精度在某种程度上受影响。朴素贝叶...原创 2018-12-19 21:26:38 · 452 阅读 · 0 评论 -
机器学习实战sklearn 构建决策树
使用sklearn 房价数据集构建决策树1、导入数据集%matplotlib inlineimport matplotlib.pyplot as pltimport pandas as pd# 导入数据from sklearn.datasets.california_housing import fetch_california_housinghousing = fetch...原创 2018-11-28 19:56:55 · 421 阅读 · 0 评论 -
Python超参数自动搜索模块GridSearchCV上手
网格搜索算法与K折交叉验证网格搜索算法和K折交叉验证法是机器学习入门的时候遇到的重要的概念。网格搜索算法是一种通过遍历给定的参数组合来优化模型表现的方法。以决策树为例,当我们确定了要使用决策树算法的时候,为了能够更好地拟合和预测,我们需要调整它的参数。在决策树算法中,我们通常选择的参数是决策树的最大深度。于是我们会给出一系列的最大深度的值,比如 {'max_depth': [1,2...转载 2018-11-30 16:07:16 · 5559 阅读 · 1 评论 -
机器学习实战sklearn_随机森林参数选择
有了之前的经验,能够对数据使用随机森林进行分析,接下来就来选择随机森林的最优参数步骤:1、数据预处理、特征选择2、调节参数3、训练4、参数微调 1、数据载入与处理import pandas as pdfeatures = pd.read_csv('data/temps_extended.csv')# One Hot features = pd.ge...原创 2018-11-30 15:41:15 · 2665 阅读 · 0 评论 -
机器学习模型评价指标+模型出错的四大原因及如何纠错
笔者寄语:机器学习中交叉验证的方式是主要的模型评价方法,交叉验证中用到了哪些指标呢?交叉验证将数据分为训练数据集、测试数据集,然后通过训练数据集进行训练,通过测试数据集进行测试,验证集进行验证。 模型预测效果评价,通常用相对绝对误差、平均绝对误差、根均方差、相对平方根误差等指标来衡量。只有在非监督模型中才会选择一些所谓“高大上”的指标如信息熵、复杂度和基尼值等等。其实这类指标只...转载 2018-11-30 12:46:33 · 3592 阅读 · 0 评论 -
机器学习实战sklearn_随机森林
一、简介这是一个使用天气数据集,建立随机森林模型,对数据集进行训练,从而对天气最高温度进行预测,步骤:1、载入数据2、数据预处理3、划分数据集为训练数据集,测试数据集4、建立模型5、预测,调优二、具体步骤,1、载入数据:import pandas as pd# 载入数据features = pd.read_csv('data/temps.csv')...原创 2018-11-30 12:30:01 · 1964 阅读 · 14 评论 -
pandas使用get_dummies进行one-hot编码
一、对数据进行编码分两种情况1、原始数据的离散特征取值之间没有大小关系,直接进行编码即可,比如周一周二,2、原始数据有大小关系,比如成绩分数之类的,直接进行数值映射即可 第一种情况,不进行数值映射,直接进行one-hot编码代码如下:import pandas as pddf = pd.DataFrame([ ['xiaoming', 'b', 15, 'mon...原创 2018-11-30 11:08:33 · 358 阅读 · 0 评论 -
sklearn 中F1-score的计算
一、相关概念对于数据测试结果有下面4种情况:真阳性(TP): 预测为正, 实际也为正假阳性(FP): 预测为正, 实际为负假阴性(FN): 预测为负,实际为正真阴性(TN): 预测为负, 实际也为负准确率(P):TP/ (TP+FP)召回率(R):TP(TP + FN)F1-score:2(PR)/(P+Rf1_score原型:sklearn....原创 2019-07-04 16:37:14 · 29689 阅读 · 1 评论