20210726_AI达人创造营_笔记

最新推荐文章于 2021-07-30 21:37:49 发布

风等雨归期

最新推荐文章于 2021-07-30 21:37:49 发布

阅读量589

点赞数 1

yongjie

本文链接：https://blog.csdn.net/qq_32342205/article/details/119117901

版权

PS：内容为课程“飞桨领航团AI达人创造营”笔记（第1、2节课）

课程链接：https://aistudio.baidu.com/aistudio/education/group/info/24607

日期：20210726（第一节课）

主题：项目创意从何而来（原文：让人拍案叫绝的创意都是如何诞生的）
主持人：韩磊（聊天机器人）
嘉宾：顾茜（坑姐，安全帽检测），颜鑫（上海，垃圾分类），郑博培（AI写诗）

尚有疑问：

了解一下树莓派！！！
颜鑫大佬的第一个项目貌似暂未公开，需尝试寻找类似项目。
（第二节课）标注视频的工具?（视频分帧然后单张标注）

韩磊：聊天机器人（项目关键技术是人脸分割和人脸关键点检测。）

创意是将现有想法进行某种组合。

图1-1：聊天机器人项目

图1-2：聊天机器人项目—流程

图1-3：聊天机器人项目—改进

万茜，安全帽检测（部署在了树莓派上）；以始为终！

开始时想部署到paddle X 上，但是遇到了问题。
之后选择逆推，从落地开始选择可实现部件。

项目的创意从哪来？从需求来进行逆推，寻找需求，进行研究。
当需求复杂时，可以先实现类似简单的项目，目的是将需求进行分解，分步进行。

项目的进度应该追求清晰，不能只是满足于当下能够看懂。

图2-1：安全帽检测—背景

图2-2：安全帽检测—实现步骤

图2-3：创意来源—以使为终，从需求入手

图2-4：创意—实现过程

图2-5：万茜小姐姐—项目创意来源

图2-6：万茜小姐姐—项目创意来源2

颜鑫：垃圾分类项目（创意来源于生活）

图3-1：创意来源于—生活

图3-2：技术可行性评估

图3-3：技术可行性评估2

图3-4：项目展示—1

PS： 1. 此项目好像尚未公开； 2. 视频最后，尝试了将作者图片输入，但结果我没有看到是什么，期待 ing。

图3-5：项目展示—2

PS：B站链接 https://www.bilibili.com/video/BV1354y1b7H7

郑博培，AI写诗

图4-1：AI写诗——项目背景/创意来源将图片与文字结合

图4-2：AI写诗—效果展示

图4-3：AI写诗—实现思路

实现思路，从最简单入手，逐步复杂。

第一步：从图片中提取信息
第二步：组合关键词；思路来源：诗中语句由关键字、词组成。
第三步：利用已有技术，输入诗的上阕，利用已有技术生成诗的下阕。

日期：20210728（第二节课）

第一部分：获取数据

Kaggle:

预测销售价格
https://www.kaggle.com/c/house-prices-advanced-regression-techniques/data?select=test.csv
猫狗分类 https://www.kaggle.com/tongpython/cat-and-dog
预测泰坦尼克号的生存情况并熟悉机器学习基础知识
https://www.kaggle.com/shuofxz/titanic-machine-learning-from-disaster

天池

遥感影像分割（Barley Remote Sensing Dataset大麦遥感检测数据集） https://tianchi.aliyun.com/dataset/dataDetail?dataId=74952
目标检测任务(人脸检测)（耶鲁人脸数据库）https://tianchi.aliyun.com/dataset/dataDetail?dataId=88824

DataFountain

花卉分类数据集 https://www.datafountain.cn/datasets/6070

其他常用的数据集官网

科大讯飞官网 https://www.xfyun.cn/service/object-recg
COCO数据集 https://cocodataset.org/#download

数据处理

数据预处理：reshape（为了规定输入网络的统一尺寸）；去中心化（有利于模型收敛）
数据增强：平移、旋转、缩放

三种常见标注工具：

Labelimg ：https://github.com/tzutalin/labelImg
Labelme（点、线等标注形式多样；可以将标注留到下一张图片）：
https://github.com/wkentaro/labelme
PPOCRLabel（百度出的，需要从GIT上下载代码然后在pycharm中运行）：
https://github.com/PaddlePaddle/PaddleOCR
OCR 光学字符识别
easydl：可以实现标注几张之后，后续自动标注。

疑问：标注视频的工具?（视频分帧然后单张标注）

关于图像

图像本质：分为位图（由像素点组成矩阵：放大会失真、体积较大、色彩逼真）和矢量图（体积小、色彩不丰富、线勾勒出区域；因不是矩阵故无法做卷积运算）

炼丹两个关键因素：数据干净、全面和超参数调优。

20210730_第三次课：关于模型参数调优

主讲人：北京联合大学机器人学院自动化专业 2018级本科生郑博培

生物的行为取决于两件事：后天学习的结果和先天的本能。

图：飞桨平台介绍

PaddleGAN：老旧照片修复，色彩增强。
PaddleSeg：抠图，并生成残影。
PaddleOCR：提取图像中的文字
ERNIE：给出关键字词，自动生成诗句或语句。
PARL：游戏中寻找最优路径。

模型选择两个标准：准确性、实时性

模型训练通用配置基本原则

每个输入数据的维度要保持一致，且一定要和模型输入保持一致。（类似与自己的数据去向模型填空）
配置学习率衰减策略时，训练的上限轮数一定要计算正确。
BatchSize不宜过大，太大容易内存溢出，且一般为2次幂。

图：学习率中的一个参数，T_max

超参优化的基本概念

参数
参数是机器学习算法的关键，是从训练数据中学习到的，属于模型的一部分。
输入一个值（x），乘以权重，结果就是网络的输出值。权重可以随着网络的训练进行更新,从而找到最佳的值,这样网络就能尝试匹配输出值与目标值。
这里的权重其实就是一种参数。

超参数
模型的超参数指的是模型外部的配置变量，是不能通过训练的进行来估计其取值不同的，且不同的训练任务往往需要不同的超参数。
超参数不同，最终得到的模型也是不同的。
一般来说，超参数有：学习率，迭代次数，网络的层数，每层神经元的个数等等。
常见的超参数有以下三类：
网络结构，包括神经元之间的连接关系、层数、每层的神经元数量、激活函数的类型等 .
优化参数，包括优化方法、学习率、小批量的样本数量等 .
正则化系数

实践中，当你使⽤神经⽹络解决问题时，寻找好的超参数其实是一件非常困难的事情，对于刚刚接触的同学来说，都是"佛系调优"，这也是一开始就"入土"的原因，没有依据的盲目瞎调肯定是不行的。

Excel中的一个实例理解反向传播

图：Excel中的一个实例理解反向传播

风等雨归期

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
20210726_AI达人创造营_笔记

日期：20210726主题：项目创意从何而来（原文：让人拍案叫绝的创意都是如何诞生的）主持人：韩磊（聊天机器人）嘉宾：顾茜（坑姐，安全帽检测），颜鑫（上海，垃圾分类），郑博培（AI写诗）韩磊：聊天机器人（项目关键技术是人脸分割和人脸关键点检测。）创意是将现有想法进行某种组合。### 万茜：安全帽检测（部署在了树莓派上）；以始为终！开始时想部署到paddle X 上，但是遇到了问题。之后选择逆推，从落地开始选择可实现部件。项目的创意从哪来？从需求来进行逆推，
复制链接

扫一扫