机器学习
文章平均质量分 93
K同学啊
“365天深度学习训练” 报名中,报名微信:mtyjkh_
展开
-
线性回归的概念
文章目录1. 前言2. 什么是回归3. 什么是线性4. 什么是线性回归5. 百度百科+维基百科6. 一元线性回归7. 损失函数8. 梯度下降------【机器学习第1天:线性回归(代码篇)】------1. 前言在上篇文章(线性回归-代码篇)中我们实现了用线性归回模型预测鸢尾花的花瓣宽度,上一篇更侧重代码的实现。在这篇文章中,我们会把重心放到理论知识上面。2. 什么是回归回归的目的是为了预测,比如上一篇文章中通过花瓣长度预测花瓣宽度回归之所以能预测是因为它通过大量的花瓣长度与宽度数据,“弄懂原创 2020-08-02 16:40:10 · 1934 阅读 · 0 评论 -
数据预处理
作者: 明天依旧可好QQ交流群: 807041986最新更新时间: 2020-12-1注:关于pandas的相关问题,若本文未涉及可在下方留言告诉我,我会在文章中进行补充的原文链接:https://mtyjkh.blog.csdn.net/article/details/84752080,欢迎转载1. 标准化数据集的标准化(Standardization)对scikit-learn中实现的大多数机器学习算法来说是常见的要求 。如果个别特征或多或少看起来不是很像标准正态分布(具有零均值和原创 2020-12-01 16:43:21 · 228 阅读 · 0 评论 -
机器学习-学习资源整理
sklearn官方文档sklearn官方文档: scikit-learnsklearn官方文档–API文档: API Referencesklearn官方文档–案例: Examples数据kaggle数据集本篇文章会随着机器学习100天系列文章的更新不断更新原创 2020-08-08 16:35:46 · 257 阅读 · 0 评论 -
TfidfVectorizer(stop_words='english',ngram_range=(1,1))中ngram_range的意义
tfidf = TfidfVectorizer(stop_words='english',ngram_range=(1,1))中ngram_range(min,max)是指将text分成min,min+1,min+2,…max 个不同的词组比如’Python is useful’中ngram_range(1,3)之后可得到’Python’ ‘is’ ‘useful’ ‘Python i...转载 2020-03-02 16:54:19 · 3365 阅读 · 0 评论 -
StratifiedKFold()与KFold()比较
一、KFold K-Folds cross-validator Provides train/test indices to split data in train/test sets. Split dataset into k consecutive folds (without shuffling by default). Each fold is then use...原创 2018-08-04 09:09:47 · 11658 阅读 · 0 评论 -
数据分析系列:绘制折线图(matplotlib)2
作者:明天依旧可好 | 柯尊柏工具:Jupyter notebook环境:Python 3.6.5与上一份代码相比我们仅仅是去掉了plt.plot()中参数x。import matplotlib.pyplot as pltimport numpy as npn = ["hubei","huangshi","wuhang","beijing","shanghai"]m = [3,1...原创 2019-07-16 22:27:40 · 508 阅读 · 0 评论 -
机器学习简介
在本篇文章中,我将对机器学习做个概要的介绍。本文的目的是能让即便完全不了解机器学习的人也能了解机器学习,并且上手相关的实践。这篇文档也算是EasyPR开发的番外篇,从这里开始,必须对机器学习了解才能进一步介绍EasyPR的内核。当然,本文也面对一般读者,不会对阅读有相关的前提要求。 在进入正题前,我想读者心中可能会有一个疑惑:机器学习有什么重要性,以至于要阅读完这篇非常长的文章呢? 我...转载 2018-10-17 10:09:40 · 34062 阅读 · 3 评论 -
机器学习第8天:IPyhon与Jupyter notebook
文章目录一、IPython是什么二、IPython的安装三、IPython功能介绍(一)用符号?获取文档一、IPython是什么ipython是一个python的交互式shell,比默认的python shell好用得多,支持变量自动补全,自动缩进,支持bash shell命令,内置了许多很有用的功能和函数。学习ipython将会让我们以一种更高的效率来使用python。同时它也是利用Pyth...原创 2018-10-15 16:47:28 · 30798 阅读 · 3 评论 -
机器学习第7天:深入了解逻辑回归
文章目录一、逻辑回归是什么二、逻辑回归的代价函数公式:一、逻辑回归是什么简单来说, 逻辑回归(Logistic Regression)是一种用于解决二分类(0 or 1)问题的机器学习方法,用于估计某种事物的可能性。比如某用户购买某商品的可能性,某病人患有某种疾病的可能性,以及某广告被用户点击的可能性等。逻辑回归是为了解决分类问题,根据一些已知的训练集训练好模型,再对新的数据进行预测属于哪个...原创 2018-10-12 22:31:27 · 30673 阅读 · 0 评论 -
机器学习第6天:数据可视化神器--Matplotlib
文章目录Matplotlib简介绘制散点图Matplotlib简介Matplotlib是一个数据可视化神器,画图用的。涉及的领域:散点图线图等高线图条形图/柱状图3D图形饼图Image图像灰度图这里主要介绍如何绘画机器学习中常用到的一些图像。绘制散点图-----数据传送门-----在这里插入代码片...原创 2018-09-28 13:20:33 · 33024 阅读 · 0 评论 -
机器学习第4天:线性回归及梯度下降
文章目录一、简单线性回归(即一元线性回归)二、代价函数梯度下降一、简单线性回归(即一元线性回归)线性回归属于监督学习,因此方法和监督学习应该是一样的,先给定一个训练集,根据这个训练集学习出一个线性函数,然后测试这个函数训练的好不好(即此函数是否足够拟合训练集数据),挑选出最好的函数(cost function最小)即可。注意:1.因为是线性回归,所以学习到的函数为线性函数,即直线函数;2...原创 2018-09-21 09:07:51 · 25165 阅读 · 0 评论 -
机器学习第3天:多元线性回归
文章目录一、具体实现步骤第1步:数据预处理导入库导入数据集将类别数据数字化躲避虚拟变量陷阱拆分数据集为训练集和测试集第2步: 在训练集上训练多元线性回归模型第3步:在测试集上预测结果第4步:数据可视化二、知识点详解1. 关于多元线性回归一、具体实现步骤第1步:数据预处理导入库import pandas as pdimport numpy as np导入数据集dataset = pd...原创 2018-09-21 08:10:19 · 26788 阅读 · 2 评论 -
机器学习第1天:数据预处理
文章目录一、预备知识二、具体实现步骤第1步:导入库第2步:导入数据集第3步:处理丢失数据第4步:解析分类数据创建虚拟变量第5步:拆分数据集为训练集合和测试集合第6步:特征标准化三、知识点详解1. Imputer处理缺损数据2. 关于fit()、transform()、fit_transform()3. StandardScaler标准化4. OneHotEncoder处理的原因5. LabelEn...原创 2018-09-18 21:52:19 · 28091 阅读 · 9 评论