机器学习
文章平均质量分 94
EwenWanW
AI编译器 移动机器人 机器人视觉 VSLAM 深度学习 目标检测识别 自动化
展开
-
Batch Normalization 批归一化 每个mini-batch进行归一化操作 显著提高深度神经网络的训练速度和性能
Batch Normalization是在每个mini-batch进行归一化操作,并将归一化操作作为模型体系结构的一部分,使用BN可以获得如下的好处,Batch Normalization(BN)是深度学习中的一个重要技术,特别在训练深度神经网络时,它带来了很多好处。可以使用更大的学习率,训练过程更加稳定,极大提高了训练速度。通过归一化操作,Batch Normalization将每个神经元的激活值限制在一个合理的范围内,使得梯度在反向传播时更加稳定,因此可以使用更大的学习率来加速训练过程。原创 2024-05-15 17:45:00 · 1005 阅读 · 0 评论 -
深度学习模型训练优化算法 神经网络模型训练 数据集 样本少 如何判断和解决共线性问题 权值初始化方法 防止梯度下降陷入局部最优解 如何考虑特征选择 梯度消失、爆炸的解决方案
神经网络模型是一种模拟人类实际神经网络的数学方法,通过大量的简单处理单元(神经元)广泛互连来形成复杂的网络系统。它反映了人脑功能的许多基本特征,是一个高度复杂的非线性动力学习系统。神经网络模型的基础在于神经元,其工作原理是通过学习和适应数据的模式和特征,从而进行预测、分类、识别等任务。原创 2024-04-12 17:15:00 · 1023 阅读 · 0 评论 -
Automatic Speech Recognition 语音识别 回声消除 AEC/AES 特征提取 声学模型 DFSMN Kaldi 语音特征提取 MFCC 离散余弦变换(DCT)
语音识别(Automatic Speech Recognition,ASR)是将语音信号转换成对应文本信息的技术。其基本原理涉及从连续声波中采样,量化每个采样值,然后对量化后的采样音频进行分帧。对于每一帧,会抽取出一个描述频谱内容的特征向量。最后,根据这些语音信号的特征来识别语音所代表的单词。语音识别技术起源于20世纪50年代,随着计算机和人工智能技术的快速发展,这项技术不断取得突破性进展,现在已经在各个领域得到广泛应用。其中,深度学习技术在语音识别领域取得了显著成果。原创 2024-04-05 17:00:00 · 972 阅读 · 0 评论 -
文字识别 Optical Character Recognition,OCR CTC STN
OCR英文全称是Optical Character Recognition,中文叫做光学字符识别。它是利用光学技术和计算机技术把印在或写在纸上的文字读取出来,并转换成一种计算机能够接受、人又可以理解的格式。文字识别是计算机视觉研究领域的分支之一,而且这个课题已经是比较成熟了,并且在商业中已经有很多落地项目了。比如汉王OCR、百度OCR、阿里OCR、腾讯OCR等等,很多企业都有能力都是拿OCR技术开始挣钱了。原创 2024-04-03 14:17:07 · 1390 阅读 · 0 评论 -
TensorFLow 基础 矩阵相乘相加 线性回归 手写字体逻辑回归 神经网络 tensorboard 显示 网络结构 和 优化记录
一、矩阵相乘相加#-*- coding:utf-8 -*- #支持中文#!/usr/bin/env python# 两个数相乘 相加import tensorflow as tf # 导入tf包a = tf.placeholder("float") # 创建一个 占位符 float类型变量 'a'b = tf.placeholder("float") # 创建一个 占位符 ...原创 2018-03-31 23:12:43 · 744 阅读 · 0 评论 -
深度学习目标检测 RCNN F-RCNN SPP yolo-v1 v2 v3 残差网络ResNet MobileNet SqueezeNet ShuffleNet
深度学习目标检测——结构变化顺序是RCNN->SPP->Fast RCNN->Faster RCNN->YOLO->SSD->YOLO2->Mask RCNN->YOLO3。博文末尾支持二维码赞赏哦_1. RCNN 区域卷积神经网络RCNN网络思想: 1. 首先使用 基于图论和层次聚类的候选框提取算法(SS...原创 2018-04-29 12:56:14 · 5468 阅读 · 0 评论