机器学习
文章平均质量分 91
以理论为指导,结合实战案例,深入理解机器学习的各个知识点
yj8023xx
不积跬步无以至千里,不积小流无以成江海
展开
-
神经网络入门案例保姆级教程
说明本教程将结合经典的神经网络入门案例,通过绘图剖析网络传播中的细节,并附上详细的求导公式,希望能帮助读者更好的理解神经网络的工作过程,由于本人也仅仅是初学者,如果文中有错误,请各位大佬及时指正案例在本案例中,我们将随机生成三类样本点,要求使用分类器将这三类样本点进行分类。首先,我们将会使用普通的线性分类器(不带激活函数)来进行分类,再使用神经网络分类器(带激活函数)进行分类,最后对比两者的分类效果import numpy as npimport matplotlib.pyplot as plt原创 2021-08-06 16:53:27 · 729 阅读 · 0 评论 -
一文搞懂机器学习中的缺失值处理(超详细)
缺失值处理数据缺失的原因缺失值的产生的原因多种多样,主要分为机械原因和人为原因。机械原因是由于机械原因导致的数据收集或保存的失败造成的数据缺失,比如数据存储的失败,存储器损坏,机械故障导致某段时间数据未能收集(对于定时数据采集而言)。人为原因是由于人的主观失误、历史局限或有意隐瞒造成的数据缺失,比如,在市场调查中被访人拒绝透露相关问题的答案,或者回答的问题是无效的,数据录入人员失误漏录了数据数据缺失的类型将数据集中不含缺失值的变量称为 完全变量 ,数据集中含有缺失值的变量称为 不完全变量完全随机缺原创 2021-04-26 13:57:28 · 2843 阅读 · 1 评论 -
机器学习 数据预处理之特征编码(归纳整理版)
特征编码由于机器学习算法都是在矩阵上执行线性代数计算,所以参加计算的特征必须是数值型的,对于非数值型的特征需要进行编码处理。对于离散型数据的编码,我们通常会使用两种方式来实现,分别是标签编码和独热编码import pandas as pdfrom sklearn.preprocessing import LabelEncoder, OneHotEncoderfrom sklearn.feature_extraction import DictVectorizer标签编码将类别型特征从字符串转换原创 2021-04-23 16:21:06 · 10943 阅读 · 13 评论 -
机器学习 数据预处理之特征缩放(理论+案例)
特征缩放原因:数量级的差异将导致量级较大的属性占据主导地位数量级的差异将导致迭代收敛速度减慢依赖于样本距离的算法对于数据的数量级非常敏感好处:提升模型的精度:在机器学习算法的目标函数(例如支持向量机的 RBF 内核或线性模型的 l1 和 l2 正则化),许多学习算法中目标函数的基础都是假设所有的特征都是零均值并且具有同一阶数上的方差。如果某个特征的方差比其他特征大几个数量级,那么它就会在学习算法中占据主导位置,导致学习器并不能像我们期望的那样,从其他特征中学习提升收敛速度:对于线性模型来原创 2021-04-22 10:30:54 · 3978 阅读 · 10 评论