自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(22)
  • 收藏
  • 关注

原创 口语时间“今天”“今天下午”“晚上八点”转成标注时间(文本)

else if(zhi<12 &&((shijian.indexOf("中午")>-1 || shijian.indexOf("下午")>-1 || shijian.indexOf("晚上")>-1)))else if (shijian.indexOf("中午") > -1 && shijian.indexOf("点") >2 ) {else if (shijian.indexOf("天") > -1 && shijian.indexOf("点") >0 ) {

2024-09-11 11:45:26 225

原创 语音交互都有什么模式?

再后来看有的公司数字人搞成全双工语音交互了,我们也尝试了下。这种交互方式允许用户和机器人同时说话,不需要唤醒。就是用户说“你好小明”,机器人开始语音识别,然后用户说话,然后机器人回答。用户还在想问什么问题的时候,语音识别就停止了。我们把我们语义降噪技术引入了进来,让机器人理解哪些话是噪音不用回答。然后我们就改成智能音箱那种交互了,即每次识别前都要说唤醒词唤醒机器人。4.语音降噪全双工语音交互:在全双工语音降噪基础上加了语义降噪能力。有的人不理解我为什么要把交互做成长监听,免唤醒的。每次交互前需要唤醒。

2024-08-15 16:25:41 136

原创 什么是语义降噪

在语音识别的过程中,要通过技术手段过滤周围噪音,就是语音降噪。通过语音降噪,把这些噪音屏蔽掉,不再识别成文字。语音降噪还可以把比较嘈杂的背景噪音过滤掉,提高语音识别正确率。更重要的是,原来那种智能音箱式每次需要唤醒的交互不是智能体之间的交互,是人在操作机器。我们用语义降噪技术开发的免唤醒交互,让机器可以主动提问、主动服务,是新一代智能体之间的交互方式。这样做的好处就是不需要每次对话都唤醒,可以长时间监听用户说话,让交互变得更高效、更自然流畅。我们用我们语义理解技术,把识别到和对话主题不想干的话都当成噪音。

2024-07-19 14:58:32 251

原创 氖星AI大脑算法重大突破

今天是2024年6月28日。我们让机器人产生自主意图,主动思考,主动服务。从此人机互动不再是人操作机器,而是真正的两个智能体之间的互动。

2024-06-28 15:29:52 111

原创 我们自己的AI已经能自主产生意图了

我们不用大语言模型,不用机器学习,也能让我们自己的AI产生意图。我们能让AI根据一个词生产与这个词相关的知识,能理解一段话的语义,能理解用户通过不规范的自然语言表达的意图。我们产品更适合语音交互场景的语义理解,尤其是电话客服机器人。这类场景要求回答快,回答简单明了。我们完全采用语言学算法,不是统计学算法,与神经网络无关。

2024-06-27 22:55:05 169

原创 氖星语义计算全过程

​我们也能处理一段话,能处理用户意图。我们计算量小,效率高,反应速度快;我们主动服务,能让机器人生成意图;我们能安装在每个机器人或者小型智能硬件上面离线服务;我们对语音交互更友好。我们虽然不如chatgpt,但是我们跟现在的生成式AI大语言模型的算法完全不一样。​现在我们主要做语音客服机器人,语音交互数字人。​我们投资才拿了300万。

2024-06-01 21:42:17 190 1

原创 我们能给大语言模型换个国产底座。求助!

有人认为我们做的语义相似没价值,大模型就可以做。其实不是的。什么是语义相似?我们语义相似计算和大模型的底层算法——句子向量距离计算是一个类型的东西,都是人工智能底层算法。我们是语言学方向,他们是统计学方向。

2024-03-28 14:13:55 311 1

原创 利用语义图谱技术构建大语言模型的细节讨论

首先要建立不同语言的语义图谱,然后计算语义的相似性,根据语义图谱进行翻译。如果已经建立了“爬行动物”的语义图谱,就可以通过“鳄鱼是爬行动物”这个知识点,让“鳄鱼”这个主题的语义图谱继承“爬行动物”语义图谱的知识。通过“乌龟是爬行动物”这个知识点,把“乌龟”这个主题的语义图谱的一些知识提炼到“爬行动物”的语义图谱里。把一篇文章变成不同的知识点,根据主题组织起来,再为每个知识点生成不同的问法,然后把矛盾冲突的地方去除,一个语义图谱就建立起来了。生成文章时根据用户的提示和文章的概念生成不同类型的文章。

2024-03-24 21:02:38 553 1

原创 使用语义图谱构建大语言模型的猜想

大语言模型是通过机器学习技术构建的生成式人工智能产品。它能回答问题、写文章、做应用题、编写程序等等。许多人认为大语言模型已经具备了推理和判断的能力,就是终极人工智能AGI。大语言模型的短板也很明显。比如:生成式AI的幻觉问题无法解决。大语言模型的幻觉问题也没法从根本上解决。需要耗费大量算力资源,消耗能源太多。无法在端上运行。缺乏个性化。

2024-03-17 11:11:43 782 1

原创 语义图谱技术介绍

语义图谱是一种新的知识表征方法。在语义图谱里,一条知识是由一个问法+一个知识点+一个主题表示的。

2022-12-05 08:57:31 587 1

原创 氖星数字人口型、动作、表情接口

本接口解决数字人在说话时口型、动作、表情和语言按照时间同步输出,以及匹配语义问题。数字人说“我很开心”时,动作和表情匹配开心的动作和表情。数字人在说“我很不开心”时,动作和表情匹配不开心的动作和表情。技术文档参考 https://www.data-baker.com/specs/file/tts_sdk_android。//输入的字母,有韵母、声母、停顿。//输入的时间轴的起点。//输入的时间轴的终点。E[9]为句子的情绪情感动作。

2022-10-25 20:42:21 2322

转载 语音交互虚拟数字人技术难点及解决方案

目前数字人要解决的技术难点有:1. 回答准确,理解自然语言口语白话。允许用户按自己想法表达,数字人依然能准确回答,这是语音交互数字人的最大难点。2. 动作自然流畅,动作和语言匹配。要能分清楚否定、肯定、祈使等不同语气并配合相应动作和表情。比如说“不”的时候摇头,说“是”的时候点头。3. 表情丰富和语言匹配并有一定的微表情。比如一个美女数字人看到帅哥会心情愉悦并会通过微表情变现出来。4. 口型和语音匹配。

2022-10-14 17:02:13 1773

转载 数字人(机器人)大脑开启IT新时代

你买了个法国机器女朋友,她不会讲话。你要和她交流,需要在脸上的触摸屏上去点击菜单进行操作。 你找了个美国机器女朋友,她会说话,但只听得懂命令。你要和她交流,只能通过语音命令来操作她。你不理她时,她也不理你。 你买了个中国机器女朋友,她是有大脑的,她懂得主动为你服务。你不找她聊天,她也会主动找你聊天。你下班回家,她已经给你做好饭了。...

2022-08-17 09:05:16 529

原创 什么是元宇宙

什么是元宇宙?元宇宙是第三代互联网。它以人工智能为核心技术,以语音交互为主要交互方式,以VR/AR、3D全息投影、机器人为载体,具备社交、电商、信息查询、通讯等等功能。元宇宙不是一个产品,它是个人人可参与的开放的生态。 ​​​美股上市公司Roblox总结了元宇宙的8个关键点:身份(Identity)、朋友(Friends)、沉浸感(Immersive)、随地(Anywhere)、多元化(Variety)、低延迟(Low Friction)、经济(Economy)、文明(Civility)。综上可

2021-09-27 09:06:24 183 1

转载 语音交互和文本搜索的本质区别

氖星智能 彭军辉 最近一直在思考一个问题:当一个用户跟一个机器人或者其他语音交互的智能硬件进行语音交流的时候,和他(她)在一个搜索引擎的输入框里输入文字查询有什么本质区别呢? 我思考这个问题是我发现很多人认为语音交互就是把语音变成文字,然后交给搜索引擎去搜结果。连行业内很多从业者都是这么认为的。 但语音交互产品的使用者却不是这么看,他们期望机器人或者其他语音交互的智能硬件能像人一样聪明,理解自己。 有一次我们一个客户跟我反馈,说他在自己机器人知识库存了条知...

2021-08-19 09:13:04 345

转载 百度、阿里们请不要再用“文本相似”来误导行业了

一直以来总有一些一知半解的人跟我讲“你做的那些10年前人家就放弃了”“你对行业的认知还停留在10年前”等等。这些人不知道的是: 1.我研究这个技术20年以来,不断有行业科班出身的教授和博士跟我讲,“你怎么还在搞。我都放弃了,这个行业实在太难了。” 2.我和主流研究的其实不是一个东西。他们是统计学方向,我是语言学方向。通常讲的自然语言处理是统计学方向的。他们的技术更适合做搜索,我的技术更适合做问答。他们处理的是文本,我处理的是语义。这里的差别比大象和蚂蚁还大。 3.主...

2021-07-19 12:03:06 484

原创 百度,你出来解释下什么是文本相似?

本文力图用作者有限的知识和经验解释清楚“什么是文本相似”“什么是语义相似”“什么是搜索相关”。 前几个月,我的一个跟了好几个月的客户忽然说他们打算借助某大公司的平台自己做问答了。 我说,你们怎么做呢? 他说,大公司的平台上就有工具能计算文本相似性。 我说,那个文本相似是搜索用的。咱机器人是问答,需要用的是语义相似计算。文本相似只给两段文本的相似值,这个值是从0-1之间的一个绝对值。两段不相干的文本也有文本相似值。你们在用的时候还得自己确定一个阈值,明确相似...

2021-06-29 07:16:22 560

原创 统计学方法做问答就是伪科学

​ 自然语言处理从方法上讲有统计学方法和语言学方法两个分支。很多人认为语言学方法是走不通的。我们从20多年前开始研究自然语言处理,一直走的是语言学方法道路。 自然语言处理有搜索、舆情监测、大数据分析、机器人翻译、问答机器人等等应用方向。有些方向更适合用语言学方法。 统计方法做搜索是对的。因为搜索本身就是个数学问题,是个概率。 统计学方法并不去深究句子内部的结构,经常忽略句子的非关键字,不处理处理语义。如果把统计学方法用于问答或者机器翻译就是伪科学。 语义本身是模...

2021-06-15 09:28:16 317

原创 你的语音交互根本不智能

很多公司都觉得自己能做好智能语音产品。其实他们只能做好命令式语音交互产品,那不是智能语音产品。 真正的智能语音交互不需要用户按某种格式表达,用户只要按照自己语言的习惯表达就好。 关于什么是智能语音交互,网上的定义都很宽泛。本文所讲的智能语音交互特指具备自然语言语义理解能力的语音交互。与智能语音交互相对的是命令式语音交互,是指只允许用户使用特定命令输入的语音交互。现在好多语音交互产品对外宣传自己是智能语音交互产品,实际上还是命令式语音交互产品。命令式语音交互和智能语音交互之间的差别...

2021-06-03 14:20:27 299

原创 氖星智能之12345在线客服机器人解决方案

在线客服行业这几年蓬勃发展,很多大公司以及政府部门采用了在线客服系统,节约了大量人力。 2018年5月23日,中共中央办公厅、国务院办公厅印发了《关于深入推进审批服务便民化的指导意见》,意见提出建立“12345”统一政务咨询投诉举报平台。以设区的市为单位,除110、120、119等紧急类热线以外,将各部门非紧急类政务热线以及网上信箱等网络渠道整合,纳入12345统一政务咨询投诉举报平台统一管理,建立“统一接收、及时分流、按责转办、限时办结、统一督办、评价反馈、行政问责”的运行机制。 ...

2021-05-24 10:48:55 845 1

原创 以用户为中心的交互(续)

氖星 彭军辉 上一篇讲了以产品为中心的交互和以用户为中心的交互,介绍了以用户为中心交互的基本概念。那篇文章我自己反复读了很多遍,总觉得意犹未尽,发现还是有很多东西没写进去。 想法的由来 其实交互应该以用户为中心的想法我在20年前就有了,只是那时候想法还不成熟,也不知道怎么实现。那时候我认为电脑就是人工智能,它应该理解人才对,不应该让人去学习它怎么用。最早我想设计个能懂用户意图的输入法软件。于是自己研究语言的规律,研究怎么让计算机理解语言的规律,利用语言的规律理解...

2021-05-07 11:09:56 184

原创 测试语义理解技术的四个维度

我们氖星智能提出了语义理解的四个维度:差异性、同一性、模糊性、一致性。差异性就是理解句子之间的细微差异。比如“这是我”“这是我的”,差了个“的”语义不同。很多语义理解厂商是不处理“的地得”的。同一性就是一个语义的不同表达。比如“你吃饭了吗”“饭你吃了吗”“吃了吗”等等,其实都是一个意思。模糊性就是用户输入错误,或者语音识别错误,机器还能正确处理。就像刚才举的例子,把“前进”识别成“天津”机器人一样执行前进的动作。一致性就是机器人说的话前后一致。不能先说“我是女孩子”后说“人家是个男的”。只有

2021-04-27 11:53:56 662

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除