- 博客(6)
- 资源 (4)
- 收藏
- 关注
翻译 揭开魔力的神秘面纱:语音识别算法内幕
与 HMM 相比,这使它们在准确性和稳健性方面表现得更好,并接受了额外的培训以适应口音、方言和说话风格——这在日益多语言的世界中是一个巨大的优势。每个提取的音素都与 HMM 中的一个状态相关联,并且模型会计算从一个状态转换到另一个状态的概率。滤波后,动态范围(样本的 “响度” 范围)被压缩,以反映我们的听觉对各种音量的不同反应。它形成了音频信号(声音)和语音的语音单位(构成语言的不同声音)之间的统计关系。语音识别技术已经取得了长足的进步,但正如任何用户都会认识到的那样,它仍远非完美。
2024-08-27 10:03:43 24
原创 了解各种 LLM 之间的差异
这是以可疑的隐私(与您放入模型中的数据有关)为代价的,有时还会以令人震惊的价格(因为您需要为每个令牌输入的使用付费)。在这些情况下,您将需要利用向量数据库(Chroma、Weaviate、Pinecone 等)来分割、嵌入和查询外部知识的相关块,并且您需要将检索到的知识注入到较短的提示中。你可以采用像XLM-Roberta或Flan这样的多语言模型,并使用你可以访问的语言数据对其进行微调,或者你可以尝试机器翻译你的提示和输出。然而,模型大小的增加也伴随着计算资源要求,这使得它们的训练和部署要求更高。
2024-07-17 10:54:42 1977
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人