前言
事情的起因是这样的。
有一天早上,女友将我气了个半死,导致我一早上气的胸口疼,心脏疼,恨不得打电话骂她一顿或者打她一顿。
但是我不敢。
只能自己气着。
但是我发现,这种生气真的非常影响身体健康,长期以往我担心自己的身体出现问题,也很影响我们的感情。
所以打算动手做个挨骂女友机器人。
使用我女友的声音,让我能够出气。
气大伤身。
这对于我来说实在是个刚需。
一、背景调查
抖音上之前有一个很火的小机器人,就像痞老板的电脑女友一般。
让我大致了解了这件事的可行性。
而抖音上各种影视作品的恶搞,也让我大概了解了使用女友声音的可行性。
算法功能可行,且难度适中。
而硬件部分,恰巧我从事智能驾驶这个行业,相关的开发板等在公司就能找到空闲的,且一些硬件的工作也可以找同时支持。
于是,我便开始了挨骂女友机器人的制作。
ps:这个系列文章是我在开始做时用作记录的,日常在上班,所以不知道什么时候会更完,大家先不要将此系列文章当做制作相关机器人的教程,也欢迎大家在评论区一起交流。
二、硬件准备
先说一下这些信息是怎么了解的。
抖音刷到了翼匠科技的视频,作者在评论区回复说:感谢虾哥的开源。
然后上网搜虾哥,原来这个机器人是小智 AI 机器人,一个开源项目。
又在网上找到一篇大佬的博客ESP32 小智 AI 机器人入门教程从原理到实现(自己云端部署)
对这部分有了一些基础的理解,于是开始准备硬件。
本着能不花钱就不花钱的原则,先搜罗公司能用的。
核心开发版,使用的是公司闲置的jetson orin nano clb开发者套件,这个搜了一下还蛮贵的。
大家一开始做的话就干脆用自己的电脑好了,等都做成了再花钱买硬件进行迁移。
文章里说的扬声器,显示器等随便好了,有什么用什么。
麦克风作为数据唯一输入,先用自己的耳机麦。
整体花费为0元。
三、整体框架
需求很明确了,要做一个挨骂女友机器人。
总共需要分为三部分:
输入【语音输入模块】:使用麦克风采集你的语音,并通过语音识别(ASR)技术将其转换为文本。
核心处理【自然语言处理(NLP)模块】:接收输入,调用大模型api接口进行处理。
输出【语音合成(TTS)模块】:接收计算得到的输出,并调用语音合成(TTS)模块,进行语音输出。
从整体框架上来看,这是一个很基础的机器人。
三大部分都有成熟的算法或者工具,而我所需要的就是进行串联并部署。
总结
这篇是我记录的第一篇,也是我进行机器人落地探索的初始,以此作为记录,希望将来有一天能实现自己的梦想。
算法方面的开发会做的较少,大部分会用现有开源的,串起来实现这些基础功能。
在此感谢所用到的所有开源算法的作者,以及网上各种科普的大佬。
让我们下一期见。