（1）山东大学项目实训第七周——大模型及其在微信小程序中的接入调研

wwwwmwwww

已于 2024-06-24 01:53:11 修改

阅读量467

点赞数 5

分类专栏：创新实训文章标签：语言模型

于 2024-03-25 11:35:37 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_68013442/article/details/136999062

版权

创新实训专栏收录该内容

13 篇文章 1 订阅

订阅专栏

本文介绍了开源大模型ChatGLM3系列，包括6B版本的强大基础模型，其支持多种功能如代码执行和在线训练示例。同时提及了语音合成模型Bark和文本转语音模型Whisper，以及大模型在实际应用中的开发指南。

摘要由CSDN通过智能技术生成

在本次实训中，我们将重点研究和探讨如何将大模型（Large Language Models, LLMs）集成到微信小程序中，尤其是开源的VisualGLM-6B模型。以下是我们对几种开源大模型的调研总结，以及为什么选择VisualGLM-6B作为我们的主要模型。

一、开源大模型

1. ChatGLM3-6B

概述

ChatGLM3-6B是新一代开源双语对话语言模型，拥有10B以下最强的基础模型。它支持工具调用（Function Call）、代码执行（Code Interpreter）、Agent任务等功能。这个模型不仅能够进行高效的对话，还能够在复杂任务中表现出色。

资源链接

1.https://github.com/THUDM/ChatGLM3

2.https://github.com/THUDM/ChatGLM-6B

应用

基于或使用了ChatGLM2-6B的开源项目包括：

Chuanhu Chat: 提供美观易用、功能丰富的用户界面，支持ChatGLM2-6B。
在线训练示例项目: 部署与微调教程，帮助用户快速上手。

2. 图像和视频生成式AI

在图像和视频生成方面，几种主要的开源模型包括：

Stable Diffusion: 开源图像生成模型，支持高度定制化的图像生成。
其他平台: 如Midjourney、DALLE2、Make-A-Video（Meta）、Imagen Video（谷歌）。

3. 语音转文本模型

Whisper

Whisper是OpenAI的开源模型，能够高效地将语音转化为文本，适用于语音识别和转录任务。

百度飞桨

飞桨是百度的开源深度学习平台，提供了一系列基础模型库，包括语音识别和合成模型。

4.多模态大模型 VisualGLM-6B

功能介绍

VisualGLM-6B是一个强大的多模态大模型，支持处理和理解多种数据类型，包括文本和图像。它不仅具备传统语言模型的对话和语言生成能力，还能够进行图像识别、图像生成和多模态信息处理。这使得它在需要综合处理多种数据类型的应用场景中表现尤为突出。

主要特点

多模态支持: VisualGLM-6B能够同时处理文本和图像数据，实现文字与图像的无缝结合。例如，它可以根据文本描述生成对应的图像，或从图像中提取相关的文本信息。
高效的对话功能: 该模型不仅支持自然语言对话，还可以理解和生成多轮对话，适用于智能客服和虚拟助手等场景。
开源和社区支持: VisualGLM-6B是一个开源模型，拥有广泛的社区支持和丰富的资源，用户可以方便地获取模型文件和相关文档，并在社区中交流和分享经验。
灵活的工具调用: 支持多种工具调用和代码执行功能，使其在处理复杂任务时更加灵活和高效。

二、进阶：如何加载和运行已经训练好的大模型

在加载和运行一个已经训练好的大模型时，需要考虑以下几点：

模型资源的获取与管理: 确保模型文件和依赖库的完整性。
硬件要求: 大模型通常需要高性能的计算资源，如GPU支持。
优化与微调: 根据具体应用场景进行模型的优化和微调，以提升性能。

为什么选择VisualGLM-6B？

1. 功能强大

VisualGLM-6B不仅在语言处理上表现出色，还支持多模态任务，包括图像和文本的联合理解与生成。这使得它在需要处理多种数据类型的应用中表现尤为突出。

2. 开源社区支持

作为一个开源模型，VisualGLM-6B拥有活跃的社区支持，用户可以方便地获取资源、交流经验，并得到及时的技术支持。这大大降低了集成和开发的难度。

3. 易于部署和微调

VisualGLM-6B提供了详细的部署和微调教程，帮助开发者快速上手，并根据具体需求进行调整。这使得它在实际应用中更加灵活和高效。

4. 性能优越

在多项基准测试中，VisualGLM-6B都表现出了领先的性能，特别是在中文和多模态任务上。这保证了它在处理复杂任务时的可靠性和准确性。

三、总结

VisualGLM-6B作为一个多模态大模型，具备强大的功能和广泛的应用潜力。通过详细的调研和实践，我们可以充分利用其多模态支持、高效的对话功能和强大的工具调用能力，将其集成到微信小程序中，实现更智能、更高效的应用场景。

关注

5
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
（1）山东大学项目实训第七周——大模型及其在微信小程序中的接入调研

关于大模型如何接入手机端的调研
复制链接

扫一扫

专栏目录

wwwwmwwww CSDN认证博客专家 CSDN认证企业博客

码龄2年

13: 原创

113万+: 周排名

8万+: 总排名

8306: 访问

: 等级

294: 积分

96: 粉丝

159: 获赞

2: 评论

145: 收藏

私信

关注

热门文章

分类专栏

创新实训 13篇

最新评论

（2）山东大学创新项目实训记录第八周——爬虫构建数据集并清洗数据
CSDN-Ada助手: 这篇博文内容丰富，展示了你在山东大学创新项目实训中的实际操作和技能应用。通过构建数据集和清洗数据，你成功提高了答案的质量，这对于景点介绍的准确性和完整性至关重要。此外，你还运用了prompt和Fiddler等工具，展现了你在数据处理和网络抓包方面的能力。在未来的创新项目中，你可以尝试探索更多数据处理和可视化技能，例如数据可视化工具Tableau或Python数据分析库Pandas。同时，了解自然语言处理技术，如BERT模型，可以帮助你更好地处理文本数据和构建更精准的模型。继续保持学习和实践，相信你会在数据领域取得更大的成就！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
（1）山东大学项目实训第七周——大模型及其在微信小程序中的接入调研
CSDN-Ada助手: 恭喜您成功发布了第一篇博客！标题看起来很有深度，对于大模型接入手机端APP这个话题进行了调研，很有见解。接下来，建议您可以在博客中详细介绍大模型接入手机端APP的具体步骤和注意事项，或者分享一些实际案例和经验教训，让读者能够更好地理解和应用这方面的知识。期待您更多精彩的博客内容！加油！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。