每日一看大模型新闻(2023.12.30-1.2)《我的世界》化身AI小镇,NPC居民角色扮演如同真人;大模型幻觉问题无解?理论证明校准的LM必然会出现幻觉;年度最热AI应用TOP 50,除了Chat

1.产品发布

1.1阿里推出AI绘图模型AnyText,会写字了!

发布日期:2023.1.1

AI绘图模型不会写字的难题,被阿里破解了 - 知乎 (zhihu.com)

主要内容:阿里巴巴推出的名为AnyText的AI绘图工具,能够准确地在图片中添加文字,并且支持中英日韩四种语言该工具的特点包括文字位置任意指定、支持多种文字风格与材质模仿,以及能够修改图片中已有的文字。它基于扩散模型开发,采用了分模块的方式来生成文字并嵌入到图像中,以提高书写精度和文字与背景的一致性。同时,AnyText的部署方式和对比测试结果,展示了它在文字准确度和图像生成方面的优势。

论文地址https://arxiv.org/abs/2311.03054

GitHubGitHub - tyxsspa/AnyText: Official implementation code of the paper <AnyText: Multilingual Visual Text Generation And Editing>

魔搭社区

魔搭社区

2.技术更新

2.1《我的世界》化身AI小镇,NPC居民角色扮演如同真人

发布日期:2023.1.2

《我的世界》化身AI小镇,NPC居民角色扮演如同真人

主要内容:《我的世界》中出现了一个由AI控制的场景,其中的人物拥有记忆和思考能力,像人类一样生活。这个场景是由一款名为LARP的基于语言的AI角色扮演框架驱动的。LARP的结构是模块化的,包括认知、人格、记忆、决策等组成部分。它通过多模块协同控制智能体,使得智能体的行为更接近人类。LARP还引入了遗忘机制,模拟人类的遗忘过程。此外,研究团队还为角色的性格塑造和能力设计了多个数据集进行训练。目前,LARP的GitHub页面已经建立,但代码尚未发布。

论文地址https://arxiv.org/abs/2312.17653

2.2大模型幻觉问题无解?理论证明校准的LM必然会出现幻觉

发布日期:2023.1.2

大模型幻觉问题无解?理论证明校准的LM必然会出现幻觉

主要内容:大型语言模型(LLM)在许多任务上表现出色,但其幻觉问题是一个主要缺陷。新研究《Calibrated Language Models Must Hallucinate》表明,经过校准的语言模型必然会产生幻觉,这是一个固有的统计学原因,与Transformer架构或数据质量无关。研究者发现,具有优良预测文本性能的语言模型必定会产生幻觉,即使在理想条件下也是如此。此外,该研究还给出了幻觉率的下限,反映了不同类型的事实产生幻觉的速率。为了减少幻觉问题,研究者建议在生成时咨询事实数据库。

论文地址https://arxiv.org/abs/2311.14648

2.3 Mamba可以替代Transformer,但它们也能组合起来使用

发布日期:2023.1.1

Mamba可以替代Transformer,但它们也能组合起来使用

主要内容:Transformer在处理长序列时存在挑战,而状态空间模型(SSM)在这方面表现出色。NeurIPS 2023的论文《Block-State Transformers》提出了将SSM与Transformer结合的新方法,称为BST。这种方法不仅能支持超长的65k token输入,而且计算效率高,速度比循环单元的Transformer快10倍。Mamba作者Tri Dao对此表示赞赏,认为SSM和Transformer可以互补。

论文地址https://arxiv.org/pdf/2306.09539.pdf

2.4这是GPT-4变笨的新解释

发布日期:2023.1.1

这是GPT-4变笨的新解释

主要内容:近期,加州大学圣克鲁斯分校的研究者发现,大型语言模型(LLM)在训练数据创建日期之前发布的数据集上的表现优于之后发布的数据集。这意味着,LLM在新任务上的零样本性能变差,主要是因为其泛化能力并不如人们所想象的那么强。这种现象被称为“任务污染”,是数据污染的一种形式。研究者通过四种方法检测了任务污染,并在论文中提供了详细的实验结果和分析。这一发现对于理解LLM的性能下降具有重要意义,并为未来的研究提供了新的方向。

2.5黄仁勋称英伟达为中国开发芯片:H20正在准备中,性能缩水

发布日期:2023.1.1

黄仁勋称英伟达为中国开发芯片:H20正在准备中 性能缩水Q2量产_凤凰网

主要内容:英伟达公司计划在2024年第二季度开始量产H20 AI GPU芯片,纬创公司将是该芯片的独家供应商。这款芯片专为中国大陆设计,计算性能受到限制,以符合美国最新出口管制要求,为中国大陆开发新的“合规芯片”,虽然降低了AI算力,但具有更低的售价、支持NVLink高速互联技术以及CUDA等。英伟达面临来自华为、英特尔和半导体初创公司等竞争对手的严峻挑战。美国官方声称将持续针对英伟达,即便其调整先进芯片以达到出口标准,仍将受到整治。

3.商业动态

3.1年度最热AI应用TOP 50,除了ChatGPT还有这么多宝藏

发布日期:2023.1.2

年度最热AI应用TOP 50,除了ChatGPT还有这么多宝藏

主要内容:这份报告盘点了全球50大热门AI工具的行业趋势(详情请点击链接查看),揭示了AI圈内更隐秘的趋势。报告显示,ChatGPT访问量遥遥领先,但单次使用时长未超过平均线。Midjourney访问量年度第四,但下滑量位居第二。Stable Diffusion作为引爆AI绘画趋势的工具,年度访问量却没进入前20名。报告还指出,全球前50名AI工具创造了超过240亿的访问量,平均每月有20亿人次访问。其中,ChatGPT就贡献了146亿,占比超60%。此外,报告还揭示了一些令人意外的数据,如AI工具的平均单次使用时长为12分34秒等。

3.2最新预测:关于AI,这些事未来十年不会变

发布日期:2023.1.2

吴恩达最新预测:关于AI,这些事未来十年不会变

主要内容

吴恩达预测:

  1. 我们需要社区
  2. 知道如何使用 AI 工具的人工作效率更高
  3. 人工智能需要好的数据才能良好运作

被LeCun点赞的八大预测:

  1. AI智能眼镜会成为现实
  2. ChatGPT之于人工智能助手,不会像谷歌之于搜索
  3. 再见LLM,你好LMM
  4. 没有重大突破,但各方面都有所改善
  5. 小即是美
  6. 开源模型将击败GPT-4,开源闭源之争将逐渐消失
  7. 基准测试仍然会是个难题
  8. 相比于现存风险,关于存在性风险的讨论不会太多

Runway CTO董事长看法:

  1. 视频生成
  2. 实时互动性
  3. 自动化AI研究
  4. 更多关注系统

3.3「唤醒」NPC,这家融资过亿的国内创企在做一种很新的游戏

发布日期:2023.1.2

「唤醒」NPC,这家融资过亿的国内创企在做一种很新的游戏

主要内容:该研究表示开放世界游戏给语言智能体带来了新的挑战,如完成复杂的任务、连贯的故事情节和多样化的 NPC 行为。为了解决上述问题,本文提出了 LARP,一个专为开放世界游戏量身定制的角色扮演语言智能体框架。LARP 由长期记忆、工作记忆、记忆处理和决策模块组成。在与环境的交互过程中,LARP 具有一个可学习的动作空间,该空间包含公共 API 和个人 API,可以通过强化学习进行扩展。为了实现角色多样化的个性,LARP 使用了针对不同视角和方言的微调模型

论文地址https://arxiv.org/pdf/2312.17653.pdf

项目地址LARP: LANGUAGE-AGENT ROLE PLAY FOR OPEN-WORLD GAMES

  • 26
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值