机器学习
王乐乐0727
这个作者很懒,什么都没留下…
展开
-
《机器学习》二,梯度下降
Q:梯度下降法是干嘛的?A:梯度下降法是一种以最快的速度找到最优解的方法!梯度下降法流程:1,初始化theta,w0…wn2,接着求梯度gradient3,theta_t+1 = theta_t - grad * learning_ratelearning_rate是个超参数,太大容易来回振荡,太小步子太短,需要走很长时间,不管太大还是太小,都会迭代次数很多,耗时很长4,等待gra...原创 2019-01-10 16:33:00 · 366 阅读 · 0 评论 -
机器学习——专有英文名称中英文对照
词汇名:ML 机器学习DL 深度学习NN 指代人工神经网络 Neural NetworksCNN 指代(深度)卷积神经网络DNN 指代深度神经网络back-propagation 反向传播算法梯度下降(Gradient Descent)玻尔兹曼机 (BM)受限玻尔兹曼机 (RBM)易辛模型 (Ising model)对比散度(contrastive divergence)算法...原创 2019-01-12 11:04:46 · 1265 阅读 · 0 评论 -
《机器学习》 一,线性回归
一,什么是线性回归线性:y=a*x 一次方的变化回归:回归到平均值简单线性回归算法==公式一元一次方程组一元指的一个X:影响Y的因素,维度一次指的X的变化:没有非线性的变化y = a*x + bx1,y1 x2,y2 x3,y3 x4,y4 …做机器学习,没有完美解只有最优解~做机器学习就是要以最快的速度,找到误差最小的最优解!一个样本的误差:yi^ - yi找...原创 2019-01-08 16:13:54 · 321 阅读 · 0 评论 -
《机器学习》三,支持向量机
支持向量机原创 2019-01-20 18:01:19 · 99 阅读 · 0 评论 -
《机器学习》 四,聚类算法①KMEANS算法
聚类算法对于"监督学习"(supervised learning),其训练样本是带有标记信息的,并且监督学习的目的是:对带有标记的数据集进行模型学习,从而便于对新的样本进行分类。而在“无监督学习”(unsupervised learning)中,训练样本的标记信息是未知的,目标是通过对无标记训练样本的学习来揭示数据的内在性质及规律,为进一步的数据分析提供基础。对于无监督学习,应用最广的便是"聚类...原创 2019-01-22 17:14:43 · 443 阅读 · 1 评论 -
决策树
一,决策树算法的核心是要解决两个问题:1)如何从数据表中找出最佳节点和最佳分枝?2)如何让决策树停止生长,防止过拟合?**sklearn中的决策树二,sklearn的基本建模流程重要参数一,criterion1,为了要将表格转化为一棵树,决策树需要找出最佳节点和最佳的分枝方法,对分类树来说,衡量这个“最佳”的指标叫做“不纯度”。2,通常来说,不纯度越低,决策树对训练集的拟合越好...原创 2019-08-03 11:18:19 · 204 阅读 · 0 评论 -
随机森林在乳腺癌数据上的调查
本次数据来源于kaggle上的自带数据,结构相对清晰简单,所有数据已经特征化1,先导入需要的库from sklearn.datasets import load_breast_cancerfrom sklearn.ensemble import RandomForestClassifierfrom sklearn.model_selection import GridSearchCVfr...原创 2019-08-20 20:38:14 · 1097 阅读 · 2 评论 -
数据处理与特征工程
**数据挖掘的五大流程**1.数据获取2. 数据预处理数据预处理是从数据中检测,纠正或删除损坏,不准确或不适用于模型的记录的过程可能面对的问题有:数据类型不同,比如有的是文字,有的是数字,有的含时间序列,有的连续,有的间断。也可能,数据的质量不行,有噪声,有异常,有缺失,数据出错,量纲不一,有重复,数据是偏态,数据量太大或太小数据预处理的目的:让数据适应模型,匹配模型的需求3. ...原创 2019-08-29 14:30:40 · 600 阅读 · 0 评论 -
遇到pandas不能读取csv文件时
data1_guokong = pd.read_csv(r'C:\Users\Administrator\Desktop\weather_data\附件1(2).csv',encoding = 'gb18030')原创 2019-09-13 22:09:54 · 2189 阅读 · 0 评论