大模型日报2024-05-22

大模型日报

 

2024-05-22

 

大模型资讯

 

  1. AI公司Anthropic研究揭示大型语言模型内部运作线索

 

  • 摘要: 近期,AI公司Anthropic的研究人员宣称他们发现了有关大型语言模型内部运作的线索。这一发现可能有助于科学家和工程师更好地理解和改进这些被称为“黑箱”的复杂系统。这对于提高人工智能的透明度和可解释性具有重要意义。

 

  1. 测试大型语言模型与人类的心智理论能力

 

  • 摘要: 心智理论,即追踪他人心理状态的能力,被认为是定义人类的核心概念。近期的研究致力于探究大型语言模型是否具备类似人类的心智理论能力,这对于理解人工智能如何模拟人类认知过程具有重要意义。

 

  1. watsonx.ai支持InstructLab,推动大型语言模型开发民主化

 

  • 摘要: watsonx.ai宣布支持InstructLab,旨在开放合作的方式中推进大型语言模型的开发,使AI构建对每个人都更加开放和民主。该平台致力于提供更好的途径,以便实现真正的协作模型开发,鼓励广泛参与和创新。

 

  1. 阿布扎比TII发布首个Falcon 2系列AI模型Falcon 2-11B

 

  • 摘要: 阿布扎比的技术创新研究所(TII)推出了Falcon 2-11B,这是Falcon 2系列的首个人工智能模型,采用5.5万亿个数据令牌进行训练,并集成了视觉语言模型。该模型代表了最新一代的语言处理技术,为用户提供了更先进的AI工具。

 

  1. 减少生成型AI和大型语言模型中的幻觉现象

 

  • 摘要: 最新消息指出,为了减少生成型人工智能和大型语言模型中的幻觉现象,Phocuswright公司即将发布一份完整报告。该报告名为《从流行词汇到底线:与旅游业中的生成型AI同步》,旨在探讨如何在旅游业中有效应用生成型AI技术,并确保其稳定可靠地服务于行业。

 

  1. 小型语言模型兴起,科技巨头发布节能低成本版本

 

  • 摘要: 随着大型语言模型如ChatGPT的高成本和能源需求问题,科技巨头们开始转向开发小型语言模型。这些小型模型不仅能够降低运营成本,还能减少对计算资源的需求,同时依然保持了较高的效能和实用性。

 

  1. 研究发现OpenAI聊天机器人在房屋购买咨询中表现出种族偏见

 

  • 摘要: 最新消息显示,OpenAI开发的聊天机器人ChatGPT在为购房者和租房者提供咨询服务时存在种族偏差。研究指出,当黑人用户咨询时,ChatGPT倾向于推荐低收入社区,这反映了长期以来住房市场中的种族偏见问题。

 

  1. 阿里巴巴在人工智能价格战中对百度、字节跳动发起重磅攻势

 

  • 摘要: 阿里巴巴云计算宣布,旗下Qwen系列的商用和开源大型语言模型使用费用大幅下调,降幅高达97%。此举被视为对竞争对手百度和字节跳动的直接挑战,有望在人工智能领域引发价格战。

 

  1. 华为推出阿拉伯语大型语言模型并在埃及开设数据中心

 

  • 摘要: 华为技术有限公司在其生成式人工智能推进计划的一部分,推出了一款阿拉伯语的大型语言模型,并在开罗建立了埃及首个公共云服务。此举意在挖掘更多商业机会和扩大其在中东地区的影响力。

 

  1. 微软推出Phi-3多模态人工智能并预览Phi-3-vision

 

  • 摘要: 微软最新发布了名为Phi-3的多模态人工智能平台,并展示了其Phi-3-vision技术。该公司邀请业界高管于6月5日回到纽约共同探讨AI模型审计的全面方法。这标志着微软在人工智能领域的又一重要进展,旨在促进AI技术的透明度与负责任的使用。

 

大模型产品

 

  1. Narrato AI批量内容生成器

 

  • 摘要: Narrato AI能在几分钟内批量生成成百上千篇内容。适用于产品描述、社交帖子、广告文案、登陆页面、博客文章、电子邮件等,支持预建和自定义AI模板。

 

  1. Smartli:AI电商内容创作助手

 

  • 摘要: Smartli,您的电商故事讲述者。借助AI技术,轻松创作吸引人的商品描述、博客、广告等内容。无论是策划下一场营销活动还是需要更新内容,Smartli帮您编织故事。

 

  1. Octoverse:构建高效AI应用助手

 

  • 摘要: Octoverse使应用开发者能够在应用中集成AI代理,这些代理不仅理解用户需求并完成任务,还在功能调用上超越GPT-4o,适用于购物、旅行预订、视频流和视频会议等多种场景。

 

  1. Edde AI:智能学术助手

 

  • 摘要: Edde.ai是一款AI驱动的学术助手工具,旨在简化学术写作和研究过程。它能帮助用户撰写论文、引用文献等,提升学术效率。

 

  1. Becc.ai:个性化AI领英助手

 

  • 摘要: Becc.ai利用AI分析你的领英帖子、语调和领域,定期通过Whatsapp发送个性化、引人注目的帖子,助你提升领英引流效果。

 

  1. AI字幕:让短视频更吸引人

 

  • 摘要: AI字幕是一款增强短视频和Reels吸引力的工具,它可以自动生成字幕、AI B-roll和配乐。通过智能技术,用户能够迅速提升视频内容的质量和观看体验,吸引更多观众。

 

  1. Copilot+ PC:超快AI智能新窗PC

 

  • 摘要: Copilot+ PC是迄今为止最快、最智能的Windows个人电脑。它配备了强大的新型硅片,可实现40+ TOPS的惊人性能,全天候电池续航,支持最先进的AI模型,让你体验前所未有的PC使用方式。

 

  1. Manycontent:智能数字营销全服务AI

 

  • 摘要: Manycontent是一款全自动服务AI,专为社交网络量身打造。它能自主发现有效内容策略,自动生成内容,并安排发布时间,旨在提升数字营销效率和效果。

 

  1. Neolocus:智能室内设计师

 

  • 摘要: Neolocus是您的私人AI室内设计师,可帮助设计和布置家居空间。仅需上传房间照片,即刻开始规划您的理想家居!

 

大模型论文

 

  1. 多模态模型适应分布漂移

 

  • 摘要: 研究表明大型多模态模型(LMMs)在自然分布漂移中具有较高鲁棒性。本文探讨了通过上下文学习(ICL)提升LMMs适应性,提出了一种新的InvariantSelectPR方法,显著提高了LMMs在不同数据集上的适应能力。

 

  1. Octo: 通用机器人策略开源政策

 

  • 摘要: 本研究提出了Octo,一种基于Transformer的通用机器人操作策略。通过在Open X-Embodiment数据集上预训练,Octo能够通过语言命令或目标图像进行指导,并能在几小时内迅速微调以适应新的感测输入和动作空间。

 

  1. MathBench:层次化数学基准测试

 

  • 摘要: MathBench是一个全新的基准测试,用于全面评估大型语言模型在数学理论及应用方面的能力。它涵盖从基础算术到大学数学的五个阶段,通过理论问题和应用题目来评价模型的数学熟练度和实际问题解决能力。

 

  1. 基于注意力BiLSTM的引文检测模型

 

  • 摘要: 本研究提出了一个结合注意力机制的双向长短期记忆网络模型,用于自动检测需要引用的句子。利用大型开放获取出版物数据集PMOA-CITE进行训练,取得了优异的性能,并通过可解释模型分析了促进和抑制引用的语言特征。

 

  1. ChatGPT在软件开发的影响调查

 

  • 摘要: 本文通过对207名软件开发者的调查,探讨了ChatGPT等大型语言模型对软件质量、生产力和工作满意度的影响,分析了开发者对其未来适应性、潜在的工作置换问题及监管干预的看法。

 

  1. Fennec:细粒度语言模型评估与修正框架

 

  • 摘要: 本文介绍了Fennec框架,通过分支和桥接操作实现细粒度语言模型评估与修正。实验表明,Fennec在多个基准测试中优于其他大型开源评估模型,并接近GPT-4水平。相关代码已开源。

 

  1. 利用大型语言模型提取问题规格

 

  • 摘要: 本文展示了如何使用大型语言模型(LLMs)将自然语言中定义的问题类映射成半形式化的规格,以便由推理和学习系统解决问题实例。研究提出了LLM驱动的认知任务分析代理,能够为自然语言指定的任务生成问题空间定义。

 

  1. MoRA: 提升大型语言模型微调效能

 

  • 摘要: 本文提出MoRA方法,通过使用方阵实现高秩更新,以增强大型语言模型在保持参数效率的同时学习和记忆新知识的能力,在五个任务上超越LoRA表现。

 

  1. 改进对话推荐的大型语言模型

 

  • 摘要: 本文提出了一种名为Reindex-Then-Adapt(RTA)的框架,通过将对话推荐系统中的多词项标题转换为单个词项,并调整其概率分布,提高了推荐的准确性。

 

大模型开源项目

 

  1. 易采集:可视化无代码爬虫工具

 

  • 摘要: 易采集是一个用JavaScript编写的开源项目,提供了一个可视化界面,用户可以不需要编写代码就能设计和执行网络爬虫任务,实现数据采集和浏览器自动化测试。

 

  1. AI4Finance-Foundation金融大模型

 

  • 摘要: AI4Finance-Foundation推出FinGPT,这是一个开源金融领域的大型语言模型。该模型在HuggingFace平台发布,旨在革新金融科技领域。项目代码使用Jupyter Notebook编写。

 

  1. fabric:AI增强人类开源框架

 

  • 摘要: fabric是一个开源框架,旨在使用AI增强人类能力。它提供了一个模块化的解决方案,通过众包的AI提示集合来解决特定问题,可广泛应用。该项目使用Python语言编写。

 

  1. rashadphz:AI搜索引擎项目

 

  • 摘要: rashadphz是一个开源的AI搜索引擎项目,支持自我托管,可与本地或云端大型语言模型(LLMs)联动。该项目使用TypeScript编写。

 

  1. ngc660sec:多功能微信机器人

 

  • 摘要: ngc660sec是一个基于HOOK机制的微信机器人,具备安全新闻推送、查询服务等多项功能,支持积分、自动拉人和广告检测。使用Python开发,易于上手。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值