深度学习和机器学习研究方向与框架介绍

最新推荐文章于 2024-07-23 20:00:00 发布

[山青花欲燃]

最新推荐文章于 2024-07-23 20:00:00 发布

阅读量5k

点赞数 7

分类专栏：深度学习文章标签：深度学习机器学习人工智能 python

本文链接：https://blog.csdn.net/qq_53904578/article/details/125774499

版权

深度学习专栏收录该内容

37 篇文章 11 订阅

订阅专栏

深度学习和机器学习研究方向与框架介绍

一、人工智能研究方向

1. 计算机视觉（Computer Vision, CV）——纯粹的深度学习方向的研究

计算机视觉，是指计算机从图像中识别出物体、场景和活动的能力。计算机视觉技术运用由图像处理操作，及其他技术所组成的序列来将图像分析任务分解为便于管理的小块任务。

深度学习是机器学习研究中的一个新的领域，其动机在于建立可以模拟人脑进行分析学习的神经网络，它模仿人脑的机制来解释数据，例如，图像、声音和文本。深度学习的目的是形成复杂算法和优势算法，属于无监督（Unsupervised）学习的一种。无监督学习的意思就是不需要通过人工方式进行样本类别的标注来完成学习。因此，深度学习是一种可以自动地学习特征的方法。

深度学习是利用多层感知器结构对非线性信息进行处理的一种学习方法。Hinton
等首先提出了深度置信网络和相应的高效学习算法，该算法具有无监督学习的能力，降低了对人工的依赖，可以较为高效地进行训练，之后深度学习发展都是在此基础上进行改进的。目前深度学习方法在对自然语言处理方面的基本方向是通过对文档上下文进行学习训练，对于中文文档，还需要先进行中文分词处理，然后将文档中的词语、句子分别用连续实值向量进行表示，形成的向量称为嵌入向量，这样做是为了方便处理文本语义特征，将词语、句子用向量表示，在处理文本语义特征时，对词向量、句向量直接进行向量上的计算即可表征它们之间的文本语义关系。

人脸相关（人脸识别转正关键点检测）
图像复原（去噪去雨去雾去模糊、超分、暗光增强）
图像补绘（Inpainting）
图像语义分割（Segmentation）
三维重建（即深度估计）
6D姿态估计
点云绘制
风格转换
OCR文本识别

2. 综合理论

神经网络安全与对抗
多任务学习
多理论学习
联邦学习
分布式机器学习
域迁移（Domain Transfer）
无监督学习（即自监督学习）的深度生成模型Generative Adversarial Networks
损失函数研究
激活函数研究

3. 自然语言处理（Natural Language Processing, NLP）——深度学习与机器学习

自然语言处理，是指计算机拥有的人类般文本处理的能力。

机器学习，指的是计算机系统无需遵照显式的程序指令，而只是依靠暴露在数据中来提升自身性能的能力。其核心在于，机器学习是从数据中自动发现模式，模式一旦被发现便可用于做预测。

机器翻译
自然语言理解
语音识别
聊天机器人
摘要生成
情感识别（经典方法是TF-IDF）
超大型语言模型研究（典型的是GTP-2、GTP-3等）

4.语音识别技术

语音识别技术，主要是关注自动且准确的转录人类的语音。该技术必须面对一些与自然语言处理类似的问题，在不同口音的处理、背景噪音、区分同音异形异义词（“buy”和“by”听起来是一样的）方面存在一些困难，同时还需要具有跟上正常语速的工作速度。

5.其他侧重于训练技术、网络架构等

引入外部知识(如知识图谱,WordNet)
- Knowledge-Based Semantic Embedding for Machine Translation
- A Neural Knowledge Language Model
深度学习与传统方法的结合。
- 人工规则与神经网络的结合
  Harnessing Deep Neural Networks with Logic Rules
- 贝叶斯与神经网络的结合
  Human-level concept learning through probabilistic program induction(论文讲的是用贝叶斯让机器模仿人写字的，但是对深度学习有非常大的启发价值）
- 迁移学习与神经网络的结合
- 强化学习与神经网络的结合
  Mastering the game of Go with deep neural networks and tree search
- 图模型与神经网络的结合
  Bidirectional LSTM-CRF Models for Sequence Tagging
  A Hierarchical Latent Variable Encoder-Decoder Model for Generating Dialogues
新的网络结构
- Highway Networks
- Neural Turing Machines
- End-To-End Memory Networks
- Deep Residual Learning for Image Recognition
- Mollifying Networks
新的训练方法
Batch Normalization Accelerating Deep Network Training by Reducing Internal Covariate Shift

二、人工智能自学框架

在这里插入图片描述

机器学习与深度学习理论
- 浅表认知：李宏毅网课+吴恩达网课+西瓜书
- 了解原理：PRML+DeepLearning（花书）
- 深刻理解：ConvexOptimization+矩阵论
数字图像理论
- 数字图像处理课程和课本、基础网课
上机实操
- 初级工具：Keras（不灵活） + 李宏毅网课
- 正规工具：Pytorch
- 高级工具：TensorFlow/Caffe

[山青花欲燃]

关注

7
点赞
踩
37

收藏

觉得还不错? 一键收藏
打赏
4
评论
深度学习和机器学习研究方向与框架介绍

计算机视觉，是指计算机从图像中识别出物体、场景和活动的能力。计算机视觉技术运用由图像处理操作，及其他技术所组成的序列来将图像分析任务分解为便于管理的小块任务。自然语言处理，是指计算机拥有的人类般文本处理的能力。机器学习，指的是计算机系统无需遵照显式的程序指令，而只是依靠暴露在数据中来提升自身性能的能力。其核心在于，机器学习是从数据中自动发现模式，模式一旦被发现便可用于做预测。语音识别技术，主要是关注自动且准确的转录人类的语音。该技术必须面对一些与自然语言处理类似的问题，在不同口音的处理、背景噪音、区分同音异
复制链接

扫一扫