DataWhale AI夏令营 大模型应用开发 - Task2 头脑风暴会笔记

会前小队进度

 1,成员组成

李哥通过群里的报名表找到了我,一拍即合组成了小队,一段时间后找到了一位大佬参与我们的项目。

2,项目雏形

张同学的经验非常丰富,阐述了目前他了解的项目的前景。

方向选择
1. 对话系统

预期产品功能
- 用户可以与聊天机器人进行自然流畅的对话。
- 聊天机器人能够理解用户的意图并给出合理的响应。
- 支持客服或教育咨询场景。

参考技术方案
- 对模型进行微调以适应特定领域的对话数据
- 设计对话管理逻辑,确保对话的连贯性和上下文相关性。

是否相对容易实现
- 中等难度。需要寻找在特定领域的数据集上进行微调,或者准备对话数据集进行微调,并设计对话流程。
我记得淘宝有发过相关的论文或者开源项目,没有找到,后续再找

2. 博客文本摘要

预期产品功能
- 自动生成文章摘要。
- 提供关键信息,便于用户快速了解文章主题。
- 分析文章关键词,快速分类

参考技术方案
- 使用模型输出摘要(但好像没有微调方向)。
- 微调模型以适应博客文章的写作风格和结构?

是否相对容易实现
- 较容易。文本摘要模型较为成熟,开源模型也可直接使用。
- 主要在于算法的选择和优化,以及对不同类型博客文章的适应性。

问题
- RAG、微调等提升模型能力的方法,提升模型能力较弱,没有太大的提升空间

3. 简单翻译

预期产品功能
- 支持特定语言对的翻译。
- 在特定领域中能够准确翻译专业术语。
- 对于中国互联网的梗的翻译也是一个细分方向

参考技术方案
- 使用Hugging Face的数据集,微调训练
- 如果有特定行业的语料
  - 可以进行微调以提高翻译质量。
  - 也可以RAG,对应补充

是否相对容易实现
- 相对容易。有完善的开源数据集可供使用
- 重点在于对特定领域术语的处理和优化。

4. B站视频问答

预期产品功能
- 根据视频内容构建知识库。
- 回答粉丝关于视频内容的常见问题。

参考技术方案
- 问答系统,主要还是RAG,使用知识库
- (未来)视频内容理解,可能需要结合计算机视觉技术和自然语言处理技术。

是否相对容易实现
- 一般,单单实现模型RAG是比较简单的
- 但知识库的搭建比较困难,直接读取字幕,可能有错误,需要进一步处理
- 使用场景问题,如果直接机器人评论用户信息,可能触发平台风控

5. 内容审核

预期产品功能
- 快速准确地检测出不当内容,包括敏感词和违规信息。
- 支持多种语言的审核,适应不同语言的文化和语境(有人使用其他语言,进行攻击)。

参考技术方案
- 建立敏感词库和违规内容模式库。
- 运用机器学习算法进行内容分类和判别。

是否相对容易实现
- 中等难度。基础功能相对容易实现,但要做到准确识别多种语言的不当内容则有一定难度。
- 需要大量标注数据来训练或微调模型以达到较高的准确性。
- 而且项目更偏向于机器学习。

6. 语音转文本的纠错

预期产品功能
- 提高语音转文本的准确性,修正识别错误。
- 能够适应不同口音和语境下的语音输入。
- 适用于字幕生成等应用场景。

参考技术方案
- 使用预训练的语音识别模型。
- 使用微调模型对输出进行后处理。

是否相对容易实现
- 中等难度。需要处理语音数据的多样性和复杂性,以及与文本的融合处理。
- 纠错部分可能需要针对特定领域的错误类型进行模型调优。

3,头脑风暴

会上

to tell your truth

还是很懵

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值