![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 72
生产队的驴儿
一个人必须不停地写作,才能不被茫茫人海湮灭。
展开
-
卷积神经网络入门五个网络之一 ResNet 网络案例
ResNet 改进点提出层间残差跳连引入前方信息,缓解梯度消失,使得神经网络层数增加 成为可能。前四个四个神经网络的层数网络层数越多,效果越好。但是效果并非如此。RetNet作者 何凯明 发现 56层网络错误率 反而高于20层网络的错误率。提出:单纯堆积神经网络层数 会使得 神经网络模型蜕化, 后面特征 会 丢失前面网络的学习的特征。eg: 下面是在cifar 10上面做的发现。于是 设计出 一根 跳连线, 直接连接 到 前面的特征。这样 既包含了 堆叠卷积的非线性输出F(x)又原创 2021-11-27 21:44:01 · 894 阅读 · 0 评论 -
卷积神经网络入门五大网络之一 Inception Net网络案例
Inception Net引入的Inception 结构块在同一层网络内 使用了 不同尺寸的卷积核,提升了模型感知力。使用了 批标准化,缓解梯度消失问题。其 核心 为 其 基本单元 inception结构块。inception v1 又称为googlenetinception v2inception v3inception v5inception 在同一层网络中,使用了不同尺寸的卷积核,提取不同尺寸的特征。1x1的卷积核: 作用 输入特征图 每个像素点。少于输入特征图 的 1x1 卷积原创 2021-11-27 21:13:33 · 1637 阅读 · 0 评论 -
CNN卷积神经网络 入门案例
数据介绍Clifar 10 数据集5w张 32x32 的图片 训练1w张 32x32 的图片 测试输入是分为10个标签,下面的图的左边已经给出了。导入数据集可视化一张图片看看打印出 x的第一张图片的像素点看看打印出 x的第一张图片对应的输出分类结果查看 测试集的整体大小 1000张 32x32像素 3通道的图片集合...原创 2021-11-22 08:01:49 · 2733 阅读 · 2 评论 -
prophet模型预测时间序列
prophet模型预测时间序列prophet:facebook开源的的一个时间序列预测算法。原理:基于时间序列分解和机器学习的拟合来做的。把时间序列 分成不同时间间隔 和 整体趋势的组合。间隔: 年 季度 月 周 日介绍一个开源数据库-Quandl 库注册网站:https://data.nasdaq.com/注册完之后,在你的个界面找到APIpip install quandl从quandl库中免费提取出特斯拉 和 通用 股票的数据import quandli原创 2021-11-11 15:19:54 · 9431 阅读 · 4 评论 -
根据学习曲线accracy判断模型过拟合or欠拟合
根据学习曲线accracy判断模型过拟合or欠拟合第一个图, 训练集和 测试集 的准确率都很低,是欠拟合。第二个图,训练集 和 测试集,之间差距大,很可能是过拟合导致的, 说明模型在训练的时候,效果好;但是在实际应用,测试集测试的情况的时候,效果和训练集 差距大。第三个图,是训练集 和 测试集 情况都差不多,属于比较好的拟合。学习曲线模型在训练集和验证集上的得分变化曲线。横坐标表示的是样本数量(x_train的数据量)的大小,纵坐标为训练集和验证集的得分(train_score, test原创 2021-11-08 13:52:51 · 3494 阅读 · 0 评论 -
深度学习 tesorflow2.0版本 入门第二章-基本概念
TensorFlow 基本概念与常见函数TensorTensorFlow 中,Tensor 表示张量,是多维数组、多维列表. 用阶表示张量的维数。0 阶张量叫做标量,表示的是一个单独的数,如 123。1 阶张量叫作向量,表示的是一个一维数组如[1,2,3]。2 阶张量叫作矩阵,表示的是一个二维数组,它可以有 i 行 j 列个元素,每个元素用它的行号和列号共同索引到,如在[[1,2,3],[4,5,6],[7,8,9]]中,数值2 的索引即为第 0 行第 1 列。小tips:张量的阶数与方括号原创 2021-11-02 20:03:43 · 470 阅读 · 0 评论 -
深度学习的小故事
人工智能三学派行为主义、符号主义和连接主义行为主义:是基于控制论的,是在构建感知、动作的控制系统。符号主义:基于算数逻辑表达式。即在求解问题时,先把问题描述为表达式,再求解表达式。例如在求解某个问题时,利用 if case 等条件语句和若干计算公式描述出来,即使用了符号主义的方法,连接主义:仿造人脑内的神经元连接关系,使人类不仅具备理性思维,还具备无法用公式描述的感性思维,如对某些知识产生记忆。深度学习基于连接主义深度学习就是 基于 模仿 人脑中神经元,从而进行预测。连接主义的神经网络模原创 2021-11-02 19:06:11 · 324 阅读 · 0 评论 -
深度学习:根据 loss曲线,对模型调参
深度学习模型调参笔记train loss 下降,val loss下降,说明网络仍在学习; 奈斯,继续训练train loss 下降,val loss上升,说明网络开始过拟合了;赶紧停止,然后数据增强、正则train loss 不变,val loss不变,说明学习遇到瓶颈;调小学习率或批量数目train loss 不变,val loss下降,说明数据集100%有问题;检查数据集标注有没有问题train loss 上升,val loss上升,说明网络结构设计不当,训练超参数设置不当,数据集经过清洗等问原创 2021-11-01 13:28:17 · 14340 阅读 · 0 评论 -
神经网络参数 ----优化器
神经网络参数优化器不同参数选取对网络影响比较大,在网络结构已经固定的情况下。神经网络优化的过程,就好比 培养一个孩子。它们都有学习的潜力,但是不同的引导方法,会让孩子向不同方向发展,达到不同的高度。优化器 就是 引导神经网络更新参数的工具。五种常用的神经网络优化器相关概念待优化参数 w损失函数loss学习率 lrbatch 将多少个数据打包当前batch的迭代次数更新过程分为4步:第一步:计算t时刻,损失函数关于当前参数的梯度就是loss函数,对每一个参数进行求偏导数..原创 2021-11-01 21:04:31 · 1195 阅读 · 0 评论 -
如何更好的拟合数据
拟合分类应对方法正则化缓解过拟合的有效方法分为 L1 正则化 和 L2正则化L1 正则化 :导致 部分参数 变为了0,是通过减少参数的数据,来降低复杂度。L2正则化: 让 参数很接近 0, 但是不等于0, L2 可以减少参数的 大小,降低复杂度。正则化部分的代码:输入 x1 ,x2 和 标签y的函数关系生成网格覆盖这些点红色表示 y为1的点,蓝色表示y为0的点。将输出为0.5的线标记出来,这条线就是0和1的区分线了。代码部分:搭建网络: 两层第一层网络: 输入2,原创 2021-11-01 20:10:25 · 775 阅读 · 0 评论 -
深度学习神经网络入门案例详细解析-鸢尾花案例
神经网络设计过程案例: 鸢尾花分类鸢尾花三种类别:三种: 狗尾巴 杂草 小腹肌通过搭建一个神经网络来对鸢尾花进行分类收集花朵 的特征值: 四种花萼长花萼宽花瓣长花瓣宽以及:三种输出结果狗尾巴 杂草 小腹肌操作方法:1.收集数据集,花的特征,以及这些花是什么品种,即 标签。2.将数据集 训练模型。通过反向传播训练。3.将不知道品种的花的特征输入模型,自动出来花的种类。神经网络模型:输入神经元 4个,输出神经元3个4个是花的四个特征3个是三种花连接关系是原创 2021-11-01 00:12:03 · 15055 阅读 · 28 评论 -
线性回归-预测房价(机器学习)
机器学习-线性回归-预测房价导入我们需要的模块包import pandas as pdimport numpy as np import matplotlib as pltimport seaborn读取数据,查看数据header = None表示不设置,表格的首字段。# 读取训练集data_train = pd.read_csv('kc_train.csv',header = None)#给数据标列名data_train.columns =["销售日期","销售价格","卧室数",原创 2021-10-24 18:59:55 · 5816 阅读 · 12 评论 -
简单的 人脸识别项目(号称一天搞定)
人脸识别项目安装openCV安装包入门级教程:推荐 python3.8 +pycharm+ anaconda需要安装pandas numpy 和 openCV装openCV比较烦Mac电脑版:首先用anaconda创建一个虚拟环境,专门用于放包依次操作是1.选择 环境2. 创建 新环境3. 在新环境 选择 unstalled 在 search框里 搜索numpy 和 pandas分别安装注意:这里输入opencv安装的时候,会报一个错误,说什么python版本的问题,有2.7原创 2021-10-02 20:19:15 · 1227 阅读 · 3 评论 -
Anaconda使用
Anaconda使用介绍: Anaconda是python的包的集成环境,不用自己一个一个手动安装。官网:https://www.anaconda.com/进入官网 下载个人版本跳转到新的页面,滑动页面到底部选择自己需要的版本graphical是图形化界面的意思,推荐使用下载好软件点开installed是默认的已经安装好的环境,这里是python默认3.8版本的切换为all可以搜索自己需要的包工具安装numpy包安装完成之后,查看,运行点击 三角形播放键 选择 终端当然py原创 2021-10-02 19:26:40 · 201 阅读 · 0 评论 -
从深度学习到CNN,RNN入门笔记
超级参数:手动输入的产生。曼哈顿距离 是绝对值欧氏距离 平方损失值: 当前的权重,拟合是好还是不好,损失值越低越好,拟合越逼。梯度下降:从山上往下下降,沿着下降速度最陡峭的方向下降。梯度方向:是当前值上升的方向的反方向。 负导数。步长:太大,容易错过最低点。错过最优解。太小,时长太长。bachsize 批处理一次传进来一张图像,更新参数,图像本身可能有问题,噪音,标注问题等。1张图像数据传进来,未必会导致参数朝正确的方向更新。bachsize 一次传进来一批数据,通过计算其平均更新原创 2021-09-22 23:12:37 · 196 阅读 · 0 评论 -
缺失值处理
缺失值处理用0来填充 nan缺失值data_train.fillna(0) 用均值填充data_train.fillna(data_train.mean()) 上下数据填充上文数据data_train.fillna(method='pad') 下文数据```pythondata_train.fillna(method='bfill') 插入值填充算法预测缺失值 填充...原创 2021-08-17 14:38:54 · 135 阅读 · 0 评论 -
机器学习面试问题
机器学习面试问题正则化1.如何防止模型的过拟合?正则化2.为什么正则化能够防止过拟合?模型的复杂度 和 参数的个数参数个数减少----->模型的复杂度就下降了3.数学角度讲一下?4.为什么L1正则化具有稀疏性?or 为什么L1正则能进行一个特征选择?什么是过拟合 欠拟合?欠拟合: 模型太过于简单,不能较好的拟合样本。过拟合:模型过于复杂如何防止过拟合?增加 L1 L2正则化L1和L2正则化区别?L1: |W| = |W1|+|W2|+…|Wn|L2:|W| =原创 2021-08-12 10:19:01 · 146 阅读 · 0 评论