开发案例| 基于Vue3+SpringBoot+腾讯云语音合成TTS+混元大模型的音频祝福小助手项目...

3b93f74ac3f1370c96ac9a26a29ccb43.png

一、业务分层

ee0c52be3a1fcd6d9a5c06b1cf0b6f6a.png

二、前置工作

2.1 API密钥创建

可以从这里进入:https://console.cloud.tencent.com/cam/capi

d4f0193a6e23a73380cce907467b59a2.png

2.2 免费额度申领

只要开通了通用语音合成服务(长文本暂不支持),无论选择预付费还是后付费的计费方式,都可以享受免费调用额度,免费调用额度将以免费资源包的形式配送,需要在 语音合成控制台 领取,领取成功后会在计费结算时优先扣减。

2.2.1 语音合成TTS免费额度

可以从这里进入:https://console.cloud.tencent.com/tts/resourcebundle

06956690f22883ce0897a8ca777fc725.png

2.2.2 混元大模型免费额度

可以从这里进入:https://console.cloud.tencent.com/hunyuan/packages

9a7a53615d15129af628dc2a0a0a166e.png

三、开发工作

云数据库和云服务器,由于时间关系,就暂时用本地个人PC替代了。

3.1 业务时序图

2257fca1bf651a8373af56b5c03dd871.png

3.2 云开发组件选型

1、腾讯云语音合成TTS

腾讯语音合成(TTS)能将文本转化为拟人化语音,满足多场景需求。具有高拟真度、灵活设置、声音多样等特性,支持多种语言、音色、音量、语速等。开通可免费领取三个月资源,接口有必填和选填参数,可通过调试选择,测试返回 base64 编码音频,前端操作简单。

产品特性
高拟真度

腾讯云基于业界领先技术构建的语音合成系统,具备合成速度快、合成语音自然流畅等特点,合成语音拟真度高,能够符合多样的应用场景,让设备和应用轻松发声,人机语音交互效果更加逼真。

灵活设置

腾讯云语音合成支持中文、英文、粤语、四川话,也可以合成中英混读语音;支持根据业务需求选择合适的音量、语速等属性;支持离线音频文件和实时音频流两种合成格式;支持电话、移动 App 等多种场景和合成效果选择。

声音多样

腾讯云语音合成支持多种男声、女声的选择,使得音色能够覆盖多样化的应用场景,适用于电话客服,小说朗读,消息播报等场景。此外,腾讯云支持为企业客户定制发声人。

付费模式
预付费

预付费资源包支持多种规格,有效期均为1年,1年内若资源包次数未使用完,则过期作废;若超额调用,则超额部分转入后付费模式。

3cc889edf18f9399a4e9888dd4bbf5dd.png

后付费

通用语音合成 按实际使用量进行计费,所有计费服务的计费周期都是自然日,每日会对上一日用量输出账单并扣费。

长文本语音合成按实际使用量进行计费,所有计费服务的计费周期都是自然日,每日会对上一日用量输出账单并扣费。

<!--br {mso-data-placement:same-cell;}--> td {white-space:nowrap;border:1px solid #dee0e3;font-size:10pt;font-style:normal;font-weight:normal;vertical-align:middle;word-break:normal;word-wrap:normal;}

计费模式

预付费

后付费

付款方式

预先付费

结算后付费

计费周期

通用语音合成(日)长文本语音合成(日)

适用场景

适用于使用量稳定,或对一年内使用量有准确预估的业务

适用于使用量有较大波动性,或无法预估的业务

2、腾讯混元大模型
产品特性

腾讯混元大模型(Tencent Hunyuan)是由腾讯研发的大语言模型,具备强大的中文创作能力,复杂语境下的逻 辑推理能力,以及可靠的任务执行能力。

腾讯混元通过采用混合专家模型(MoE)结构,推动了性能提升和推理成本下降。在中文表现尤其是在文本生成、数理逻辑和多轮对话上性能表现卓越,整体处于业界领先水平。支持AI 搜索联网插件,通过整合腾讯优质的内容生态(如微信公众号、视频号等)和全网搜索,使混元具备强大的时新、深度内容获取和AI问答能力。

同时,混元还采用了各种技术手段来提高模型的性能和效果,例如使用掩码策略、使用不同的优化算法、进行数据增强等。这些技术手段可帮助模型更好地处理文本数据,提高模型的泛化能力和生成效果。

腾讯混元大模型目前覆盖四大核心能力:

多轮对话

具备上下文理解和长文记忆能力,流畅完成各专业领域的多轮问答。

知识增强

有效解决事实性、时效性问题,快速检索相关内容,提升内容生成效果。

逻辑推理

准确理解用户意图,擅长数学推导,基于输入数据或信息进行推理、分析和规划。

内容创作

支持文学创作、文本概要、角色扮演、文生图和图生文等多模态创作能力,生成内容流畅、规范、中立、客观。

付费模式

be30b882b8d14ed6a1849b5ca9ce33c4.png

云数据库优势

腾讯云数据库 MySQL 为用户提供更轻松地云上设置、操作和扩展数据库服务,具备灵活易用、高可用、高数据安全可靠性等优势:

<!--br {mso-data-placement:same-cell;}--> td {white-space:nowrap;border:1px solid #dee0e3;font-size:10pt;font-style:normal;font-weight:normal;vertical-align:middle;word-break:normal;word-wrap:normal;}

对比项

云数据库 MySQL

CVM 自建

自购服务器搭建数据库

可用性

双节点、三节点提供自研高可用系统,实现30秒内故障恢复。只读实例自动实现负载均衡。读写分离使用方便。未来会推出分析节点,满足分析型场景需求。

需要单独购买高可用系统。需要单独实现或者购买负载均衡服务。分析型场景需要与分析型数据库结合,搭建难度大、成本高。

单机实例,少则两小时,多则等待配货数周。需要单独购买高可用系统。需要单独实现或者购买负载均衡设备。分析型场景需要与分析型数据库结合,搭建难度大、成本高。

可靠性

数据可靠性高,自动主备复制、数据备份、日志备份等。MySQL 5.7三节点与 MySQL 8.0三节点,实现 RPO(Recovery Point Object)= 0,数据无丢失;RTO(Recovery Time Objectiv

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

后台技术汇

对你的帮助,是对我的最好鼓励。

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值