GPT-4o用不上,国产平替海螺AI可以先试试

AI领域本周都卷起来对话式交互

前有OpenAI推出实时视频通话如真人的GPT-4o,后有谷歌与之类似的Astra。

但不论是GPT-4o还是Astra,都或多或少有一些使用门槛

也许是看到了这种gap,一款类似能力的国产AI应用,也悄然更新了……

在这里插入图片描述

能力和体验上,可能跟GPT-4o和Astra演示的还有差距。

但作为门槛更友好的平替,也足够了。

这款产品是国产大模型公司MiniMax的海螺AI,主打**AI助手****+**实时语音聊天

那么它有哪些具体应用场景呢?

海螺AI能干什么?

海螺AI是MiniMax推出的一款多模态AI生产力工具,能听、能写、能说、能识图。

概括而言,官方此次对这款产品作了如下更新:

  • 多模态互动:海螺AI支持文本、音频和图像。用户可以通过打字输入、拍照识图或语音通话与AI进行互动。
  • 语音通话功能:海螺AI的一个显著特点是支持语音交互。用户可以直接与AI进行语音通话,这在做饭、洗脸等不方便打字的情况下尤为方便。此外,这个功能还非常适合练习英语口语和模拟面试。
  • 教育和职场应用:海螺AI提供学习助手和工作助手功能。包括课程报告生成、知识点问答、作文辅导、背单词、周报生成、工作汇报编写等,适用于学生、教育者和职场人士。
  • 内容创作和数据处理:海螺AI支持生成多种社交媒体文案,如小红书、短视频脚本和公众号文章等。同时,它还能进行智能搜索和数据查询,帮助用户获取企业信息、金融数据和学术研报等。

(以下为原速实测)

语音播报今日热点

上下班开车途中,可以让海螺AI播报今日热点,并随意聊天。

读论文、读财报

接着来看一项日常学习工作都需要用到的能力——快速总结长文本

直接拿最常见的学术论文和公司财报来试试。

海螺AI总结论文

整体较为流畅,看来十几页的论文对它来说不算挑战。

难度加码!这一次我们喂给它有大量数据报表的公司财报。

随机选取华夏银行今年1季度报告

免费查数据

除了速读长文本,作为一款AI助手,检索并快速整合信息也是关键。

先就日常生活来说,我们来试试让海螺AI做旅行攻略

比如“从重庆出发前往深圳再去长沙的五天旅游规划方案”。

短短几个字估计能瞬间让倾向于细致规划的“J人”炸毛。

此外,海螺AI接入了天眼查、萝卜投研和学科网等专业数据库,能够让用户免费搜索专业数据。

随便想了一个例子,“帮我查下量子位的工商数据”。

辅导作业

海螺AI还能帮助父母辅导孩子功课。

我们直接上传一张小学数学应用题常见的“相遇问题”。

可以看到,海螺AI按照步骤进行了解答。(移动端支持直接拍照上传)

写作

由于写规划、写报告、写文案等对几乎所有AI来说都是常规操作,在此我们不再展示。

但是,当我们驱散班味儿,想用AI写作来搞副业时,海螺AI能否派上用场?

让我们直接提示它“帮我构思一个职场女性黑化逆袭重生的爽文霸总剧本”。

英语口语陪练

海螺AI支持口语练习,用户可以用它来练雅思和托福、CET4/6、PET等。

海螺AI提供雅思面试建议

小结

单从本周热门的“对话式交互”来说,它和GPT-4o及Astra还存在一定差距。

这主要体现在:

  • 海螺AI能听能说,但是不能看,无法像打视频一样感知周围环境
  • 当海螺AI说话时,无法通过语音沟通打断,不过有一个暂停按钮
  • 海螺AI在实时能力上仍有提升空间,不过目前体验下来影响不大

总之,对于这样一款能立即上手甚至免费的国产AI来说,瑕不掩瑜,值得一试。

技术原理:自研多模态MOE大模型

对于海螺AI背后的技术,更早之前,官方也有过披露,分为以下两个方面:

万亿参数MoE大语言模型

今年4月,MiniMax推出了万亿MoE模型abab-6.5,并在其基础上开发了生产力工具“海螺AI”。

根据MiniMax发布的技术报告,在各类核心能力测试中,abab-6.5接近 GPT-4、Claude 3 Opus 、Gemini 1.5 Pro等世界领先的大语言模型。
在这里插入图片描述

MiniMax语音大模型

另外,海螺AI还接入了MiniMax语音大模型——speech-01。

这一模型的主要特色是:

  • 高度接近人声,且能用声音表达情感
  • 可模仿数千个声音的音色特征,并生成声音变体
  • 支持30秒克隆音色

首先,官方称海螺AI可以很好的理解人类的语言、语气、情感。

让我们整蛊一下小海螺。

要求它在同一句话里表达出喜怒哀乐等情绪,看看能否听出明显差别。

其次,官方称海螺AI不仅限于模仿单一的声音,它还能通过学习数千个声音的音色特征,生成更多声音变体。

目前它精通中文、英文、德文、法文等8国语言,还预置了30多种音色

在这里插入图片描述

最后,官方称海螺AI只需30秒的音频样本,就能快速复刻出与原音色高度相似的语音。

打造者:国内独角兽MiniMax

MiniMax是一家成立于2021年12月的人工智能初创公司,由前商汤科技副总裁、研究院副院长闫俊杰创立,成员主要来自商汤科技等知名AI公司。

在这里插入图片描述

闫俊杰在2021世界人工智能大会算法典范总决赛上

2022年7月,MiniMax完成了Pre-A轮融资,投资方包括明势资本和米哈游等。

2023年6月,MiniMax完成了一轮超过2.5亿美元的融资,投资者包括与腾讯有关联的实体。

今年3月,MiniMax的最新一轮融资由阿里巴巴领投,金额至少为6亿美元,这使得公司估值超过25亿美元

目前,MiniMax主打三款产品,分别为MiniMax API开放平台、沉浸式AI内容社区星野、以及生产力工具海螺AI。

GPT-4o用不上,国产平替海螺AI可以先试试

AI领域本周都卷起来对话式交互

前有OpenAI推出实时视频通话如真人的GPT-4o,后有谷歌与之类似的Astra。

但不论是GPT-4o还是Astra,都或多或少有一些使用门槛

也许是看到了这种gap,一款类似能力的国产AI应用,也悄然更新了……

图片

能力和体验上,可能跟GPT-4o和Astra演示的还有差距。

但作为门槛更友好的平替,也足够了。

这款产品是国产大模型公司MiniMax的海螺AI,主打**AI助手****+**实时语音聊天

那么它有哪些具体应用场景呢?

海螺AI能干什么?

海螺AI是MiniMax推出的一款多模态AI生产力工具,能听、能写、能说、能识图。

概括而言,官方此次对这款产品作了如下更新:

  • 多模态互动**:**海螺AI支持文本、音频和图像。用户可以通过打字输入、拍照识图或语音通话与AI进行互动。
  • **语音通话功能:**海螺AI的一个显著特点是支持语音交互。用户可以直接与AI进行语音通话,这在做饭、洗脸等不方便打字的情况下尤为方便。此外,这个功能还非常适合练习英语口语和模拟面试。
  • **教育和职场应用:**海螺AI提供学习助手和工作助手功能。包括课程报告生成、知识点问答、作文辅导、背单词、周报生成、工作汇报编写等,适用于学生、教育者和职场人士。
  • **内容创作和数据处理:**海螺AI支持生成多种社交媒体文案,如小红书、短视频脚本和公众号文章等。同时,它还能进行智能搜索和数据查询,帮助用户获取企业信息、金融数据和学术研报等。

(以下为原速实测)

语音播报今日热点

上下班开车途中,可以让海螺AI播报今日热点,并随意聊天。

,时长02:03

读论文、读财报

接着来看一项日常学习工作都需要用到的能力——快速总结长文本

直接拿最常见的学术论文和公司财报来试试。

,时长00:31

海螺AI总结论文

整体较为流畅,看来十几页的论文对它来说不算挑战。

难度加码!这一次我们喂给它有大量数据报表的公司财报。

,时长00:38

随机选取华夏银行今年1季度报告

免费查数据

除了速读长文本,作为一款AI助手,检索并快速整合信息也是关键。

先就日常生活来说,我们来试试让海螺AI做旅行攻略

比如“从重庆出发前往深圳再去长沙的五天旅游规划方案”。

短短几个字估计能瞬间让倾向于细致规划的“J人”炸毛。

,时长00:50

此外,海螺AI接入了天眼查、萝卜投研和学科网等专业数据库,能够让用户免费搜索专业数据。

随便想了一个例子,“帮我查下量子位的工商数据”。

,时长00:37

辅导作业

海螺AI还能帮助父母辅导孩子功课。

我们直接上传一张小学数学应用题常见的“相遇问题”。

可以看到,海螺AI按照步骤进行了解答。(移动端支持直接拍照上传)

,时长00:23

写作

由于写规划、写报告、写文案等对几乎所有AI来说都是常规操作,在此我们不再展示。

但是,当我们驱散班味儿,想用AI写作来搞副业时,海螺AI能否派上用场?

让我们直接提示它“帮我构思一个职场女性黑化逆袭重生的爽文霸总剧本”。

,时长00:40

英语口语陪练

海螺AI支持口语练习,用户可以用它来练雅思和托福、CET4/6、PET等。

,时长00:29

海螺AI提供雅思面试建议

小结

单从本周热门的“对话式交互”来说,它和GPT-4o及Astra还存在一定差距。

这主要体现在:

  • 海螺AI能听能说,但是不能看,无法像打视频一样感知周围环境
  • 当海螺AI说话时,无法通过语音沟通打断,不过有一个暂停按钮
  • 海螺AI在实时能力上仍有提升空间,不过目前体验下来影响不大

总之,对于这样一款能立即上手甚至免费的国产AI来说,瑕不掩瑜,值得一试。

技术原理:自研多模态MOE大模型

对于海螺AI背后的技术,更早之前,官方也有过披露,分为以下两个方面:

万亿参数MoE大语言模型

今年4月,MiniMax推出了万亿MoE模型abab-6.5,并在其基础上开发了生产力工具“海螺AI”。

根据MiniMax发布的技术报告,在各类核心能力测试中,abab-6.5接近 GPT-4、Claude 3 Opus 、Gemini 1.5 Pro等世界领先的大语言模型。

![外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传](https://img-home.csdnimg.cn/images/20230724024159.png?origin_url=data%3Aimage%2Fsvg%2Bxml%2C%253C%253Fxml%20version%3D’1.0’%20encoding%3D’UTF-8’%253F%253E%253Csvg%20width%3D’1px’%20height%3D’1px’%20viewBox%3D’0%200%201%201’%20version%3D’1.1’%20xmlns%3D’http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg’%20xmlns%3Axlink%3D’http%3A%2F%2Fwww.w3.org%2F1999%2Fxlink’%253E%253Ctitle%253E%253C%2Ftitle%253E%253Cg%20stroke%3D’none’%20stroke-width%3D’1’%20fill%3D’none’%20fill-rule%3D’evenodd’%20fill-opacity%3D’0’%253E%253Cg%20transform%3D’translate(-249.000000%2C%20-126.000000&pos_id=img-UU8WKuP8-1716168834662)’ fill=‘%23FFFFFF’%3E%3Crect x=‘249’ y=‘126’ width=‘1’ height=‘1’%3E%3C/rect%3E%3C/g%3E%3C/g%3E%3C/svg%3E)

MiniMax语音大模型

另外,海螺AI还接入了MiniMax语音大模型——speech-01。

这一模型的主要特色是:

  • 高度接近人声,且能用声音表达情感
  • 可模仿数千个声音的音色特征,并生成声音变体
  • 支持30秒克隆音色

首先,官方称海螺AI可以很好的理解人类的语言、语气、情感。

让我们整蛊一下小海螺。

要求它在同一句话里表达出喜怒哀乐等情绪,看看能否听出明显差别。

,时长00:20

其次,官方称海螺AI不仅限于模仿单一的声音,它还能通过学习数千个声音的音色特征,生成更多声音变体。

目前它精通中文、英文、德文、法文等8国语言,还预置了30多种音色

![外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传](https://img-home.csdnimg.cn/images/20230724024159.png?origin_url=data%3Aimage%2Fsvg%2Bxml%2C%253C%253Fxml%20version%3D’1.0’%20encoding%3D’UTF-8’%253F%253E%253Csvg%20width%3D’1px’%20height%3D’1px’%20viewBox%3D’0%200%201%201’%20version%3D’1.1’%20xmlns%3D’http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg’%20xmlns%3Axlink%3D’http%3A%2F%2Fwww.w3.org%2F1999%2Fxlink’%253E%253Ctitle%253E%253C%2Ftitle%253E%253Cg%20stroke%3D’none’%20stroke-width%3D’1’%20fill%3D’none’%20fill-rule%3D’evenodd’%20fill-opacity%3D’0’%253E%253Cg%20transform%3D’translate(-249.000000%2C%20-126.000000&pos_id=img-S31UUdza-1716168834662)’ fill=‘%23FFFFFF’%3E%3Crect x=‘249’ y=‘126’ width=‘1’ height=‘1’%3E%3C/rect%3E%3C/g%3E%3C/g%3E%3C/svg%3E)

最后,官方称海螺AI只需30秒的音频样本,就能快速复刻出与原音色高度相似的语音。

,时长00:27

打造者:国内独角兽MiniMax

MiniMax是一家成立于2021年12月的人工智能初创公司,由前商汤科技副总裁、研究院副院长闫俊杰创立,成员主要来自商汤科技等知名AI公司。

![外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传](https://img-home.csdnimg.cn/images/20230724024159.png?origin_url=data%3Aimage%2Fsvg%2Bxml%2C%253C%253Fxml%20version%3D’1.0’%20encoding%3D’UTF-8’%253F%253E%253Csvg%20width%3D’1px’%20height%3D’1px’%20viewBox%3D’0%200%201%201’%20version%3D’1.1’%20xmlns%3D’http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg’%20xmlns%3Axlink%3D’http%3A%2F%2Fwww.w3.org%2F1999%2Fxlink’%253E%253Ctitle%253E%253C%2Ftitle%253E%253Cg%20stroke%3D’none’%20stroke-width%3D’1’%20fill%3D’none’%20fill-rule%3D’evenodd’%20fill-opacity%3D’0’%253E%253Cg%20transform%3D’translate(-249.000000%2C%20-126.000000&pos_id=img-NeHAb1aa-1716168834662)’ fill=‘%23FFFFFF’%3E%3Crect x=‘249’ y=‘126’ width=‘1’ height=‘1’%3E%3C/rect%3E%3C/g%3E%3C/g%3E%3C/svg%3E)

闫俊杰在2021世界人工智能大会算法典范总决赛上

2022年7月,MiniMax完成了Pre-A轮融资,投资方包括明势资本和米哈游等。

2023年6月,MiniMax完成了一轮超过2.5亿美元的融资,投资者包括与腾讯有关联的实体。

今年3月,MiniMax的最新一轮融资由阿里巴巴领投,金额至少为6亿美元,这使得公司估值超过25亿美元

目前,MiniMax主打三款产品,分别为MiniMax API开放平台、沉浸式AI内容社区星野、以及生产力工具海螺AI。

如何学习AI大模型?

现在社会上大模型越来越普及了,已经有很多人都想往这里面扎,但是却找不到适合的方法去学习。

作为一名资深码农,初入大模型时也吃了很多亏,踩了无数坑。现在我想把我的经验和知识分享给你们,帮助你们学习AI大模型,能够解决你们学习中的困难。

我已将重要的AI大模型资料包括市面上AI大模型各大白皮书、AGI大模型系统学习路线、AI大模型视频教程、实战学习,等录播视频免费分享出来,需要的小伙伴可以扫取。

在这里插入图片描述

一、AGI大模型系统学习路线

很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,我下面分享的这个学习路线希望能够帮助到你们学习AI大模型。

在这里插入图片描述

二、AI大模型视频教程

在这里插入图片描述

三、AI大模型各大学习书籍

在这里插入图片描述

四、AI大模型各大场景实战案例

在这里插入图片描述

四、结束语

学习AI大模型是当前科技发展的趋势,它不仅能够为我们提供更多的机会和挑战,还能够让我们更好地理解和应用人工智能技术。通过学习AI大模型,我们可以深入了解深度学习、神经网络等核心概念,并将其应用于自然语言处理、计算机视觉、语音识别等领域。同时,掌握AI大模型还能够为我们的职业发展增添竞争力,成为未来技术领域的领导者。

再者,学习AI大模型也能为我们自己创造更多的价值,提供更多的岗位以及副业创收,让自己的生活更上一层楼。

因此,学习AI大模型是一项有前景且值得投入的时间和精力的重要选择。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值