提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
前言
提示:这里可以添加本文要记录的大概内容:
例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。
提示:以下是本篇文章正文内容,下面案例可供参考
一、什么是机器学习
机器学习就是在找一个函数:这个函数是人类写不出来的,但是机器可以通过这个函数完成任务:
·语音辨识
声音讯号通过函数转化为文字
·图像辨识
将图片转化为某个定义
二、本课程专注于深度学习
- 类神经网络的输入:
·向量
·矩阵==图片
·队列==语音、文字
- 类神经网络的输出:
·数字:regression(回归函数)
·选择一个结果:分类
·生成一个文字/图像
- 作业:
·covid-19的确诊率预测
·风铃的分类(语音辨识的)
·音像辨识
·语音辨识
·机器翻译(读中文翻译成英文)
·动漫人脸的生成
三、机器怎么学到函数的
- 1-5讲:监督学习
需要训练数据来训练和标记数据
交给机器让机器学习
- 7讲:半监督学习
- 期望模型在训练之前就有一定的基本功:
pre-trian
- 联系pretrain的时候不用标注:
通过左右变换图片/更改图片颜色问机器是否是一样
在模型对图片是否翻转后仍然是一个物体、这种能力学成后,更能够很好的关注下游数据图像分类的任务
eg:就像现在开发一个app比较容易,是因为底层接口已经由ios和android做好了;因此开发起来比较方方便
- pre-train 模型尝尝被叫做:Foundation Model
比较出名的:BERT
BERT有340M参数
【花絮】老师用进击的巨人比喻预训练模型们
- 6讲:Generative Adversarial Network
传统的监督学习x和y之间的关系需要人为标注
Generative Adversarial Network技术可以对大量集合x和集合y自动
传统的监督学习x和y之间的关系需要人为标注
Generative Adversarial Network技术可以对大量集合x和集合y自动找对应的关系传递给函数
https://arxiv.org/abs/2105.111084(facebook)
- 12讲:Reinforcement Learning(RL)
通常是不知道怎么标注数据的时候,但是可以判断好坏可以用该技术
=====不仅仅关注准确率=====
- 8讲:异常检测Anomaly Detection
给机器回答不知道/不清楚的情况
- 9讲:Explainable AI
不仅仅回答正确大概,还要其回答为什么的原因
可以让机器绘制出图片中哪里比较重要
- 10讲:模型攻击
给照片添加噪声,模型很有可能没办法得知到底是什么东西
模型有什么攻击的技术。以及防御的可能性
- 11讲:domain Adaption
就是训练集是黑白的但是测试集和彩色的,因此想找技术能够修复
- 13讲:模型压缩
当运算资源有限的时候,可以用技术压缩模型
- 14讲:Life-long learning
为什么没办法制作一个终生学习的机器
- 15讲:学习如何学习 meta learing
Meta Learing = learn to learn ==》few-shot learing 少数量训练集
让机器从过去学习的方法里选择,新的演算方法
总结
提示:这里对文章进行总结:
例如:以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。