大模型日报
2024-05-22
大模型资讯
- 摘要: 近期,AI公司Anthropic的研究人员宣称他们发现了有关大型语言模型内部运作的线索。这一发现可能有助于科学家和工程师更好地理解和改进这些被称为“黑箱”的复杂系统。这对于提高人工智能的透明度和可解释性具有重要意义。
- 摘要: 心智理论,即追踪他人心理状态的能力,被认为是定义人类的核心概念。近期的研究致力于探究大型语言模型是否具备类似人类的心智理论能力,这对于理解人工智能如何模拟人类认知过程具有重要意义。
- 摘要: watsonx.ai宣布支持InstructLab,旨在开放合作的方式中推进大型语言模型的开发,使AI构建对每个人都更加开放和民主。该平台致力于提供更好的途径,以便实现真正的协作模型开发,鼓励广泛参与和创新。
- 摘要: 阿布扎比的技术创新研究所(TII)推出了Falcon 2-11B,这是Falcon 2系列的首个人工智能模型,采用5.5万亿个数据令牌进行训练,并集成了视觉语言模型。该模型代表了最新一代的语言处理技术,为用户提供了更先进的AI工具。
- 摘要: 最新消息指出,为了减少生成型人工智能和大型语言模型中的幻觉现象,Phocuswright公司即将发布一份完整报告。该报告名为《从流行词汇到底线:与旅游业中的生成型AI同步》,旨在探讨如何在旅游业中有效应用生成型AI技术,并确保其稳定可靠地服务于行业。
- 摘要: 随着大型语言模型如ChatGPT的高成本和能源需求问题,科技巨头们开始转向开发小型语言模型。这些小型模型不仅能够降低运营成本,还能减少对计算资源的需求,同时依然保持了较高的效能和实用性。
- 摘要: 最新消息显示,OpenAI开发的聊天机器人ChatGPT在为购房者和租房者提供咨询服务时存在种族偏差。研究指出,当黑人用户咨询时,ChatGPT倾向于推荐低收入社区,这反映了长期以来住房市场中的种族偏见问题。
- 摘要: 阿里巴巴云计算宣布,旗下Qwen系列的商用和开源大型语言模型使用费用大幅下调,降幅高达97%。此举被视为对竞争对手百度和字节跳动的直接挑战,有望在人工智能领域引发价格战。
- 摘要: 华为技术有限公司在其生成式人工智能推进计划的一部分,推出了一款阿拉伯语的大型语言模型,并在开罗建立了埃及首个公共云服务。此举意在挖掘更多商业机会和扩大其在中东地区的影响力。
- 摘要: 微软最新发布了名为Phi-3的多模态人工智能平台,并展示了其Phi-3-vision技术。该公司邀请业界高管于6月5日回到纽约共同探讨AI模型审计的全面方法。这标志着微软在人工智能领域的又一重要进展,旨在促进AI技术的透明度与负责任的使用。
大模型产品
- 摘要: Narrato AI能在几分钟内批量生成成百上千篇内容。适用于产品描述、社交帖子、广告文案、登陆页面、博客文章、电子邮件等,支持预建和自定义AI模板。
- 摘要: Smartli,您的电商故事讲述者。借助AI技术,轻松创作吸引人的商品描述、博客、广告等内容。无论是策划下一场营销活动还是需要更新内容,Smartli帮您编织故事。
- 摘要: Octoverse使应用开发者能够在应用中集成AI代理,这些代理不仅理解用户需求并完成任务,还在功能调用上超越GPT-4o,适用于购物、旅行预订、视频流和视频会议等多种场景。
- 摘要: Edde.ai是一款AI驱动的学术助手工具,旨在简化学术写作和研究过程。它能帮助用户撰写论文、引用文献等,提升学术效率。
- 摘要: Becc.ai利用AI分析你的领英帖子、语调和领域,定期通过Whatsapp发送个性化、引人注目的帖子,助你提升领英引流效果。
- 摘要: AI字幕是一款增强短视频和Reels吸引力的工具,它可以自动生成字幕、AI B-roll和配乐。通过智能技术,用户能够迅速提升视频内容的质量和观看体验,吸引更多观众。
- 摘要: Copilot+ PC是迄今为止最快、最智能的Windows个人电脑。它配备了强大的新型硅片,可实现40+ TOPS的惊人性能,全天候电池续航,支持最先进的AI模型,让你体验前所未有的PC使用方式。
- 摘要: Manycontent是一款全自动服务AI,专为社交网络量身打造。它能自主发现有效内容策略,自动生成内容,并安排发布时间,旨在提升数字营销效率和效果。
- 摘要: Neolocus是您的私人AI室内设计师,可帮助设计和布置家居空间。仅需上传房间照片,即刻开始规划您的理想家居!
大模型论文
- 摘要: 研究表明大型多模态模型(LMMs)在自然分布漂移中具有较高鲁棒性。本文探讨了通过上下文学习(ICL)提升LMMs适应性,提出了一种新的InvariantSelectPR方法,显著提高了LMMs在不同数据集上的适应能力。
- 摘要: 本研究提出了Octo,一种基于Transformer的通用机器人操作策略。通过在Open X-Embodiment数据集上预训练,Octo能够通过语言命令或目标图像进行指导,并能在几小时内迅速微调以适应新的感测输入和动作空间。
- 摘要: MathBench是一个全新的基准测试,用于全面评估大型语言模型在数学理论及应用方面的能力。它涵盖从基础算术到大学数学的五个阶段,通过理论问题和应用题目来评价模型的数学熟练度和实际问题解决能力。
- 摘要: 本研究提出了一个结合注意力机制的双向长短期记忆网络模型,用于自动检测需要引用的句子。利用大型开放获取出版物数据集PMOA-CITE进行训练,取得了优异的性能,并通过可解释模型分析了促进和抑制引用的语言特征。
- 摘要: 本文通过对207名软件开发者的调查,探讨了ChatGPT等大型语言模型对软件质量、生产力和工作满意度的影响,分析了开发者对其未来适应性、潜在的工作置换问题及监管干预的看法。
- 摘要: 本文介绍了Fennec框架,通过分支和桥接操作实现细粒度语言模型评估与修正。实验表明,Fennec在多个基准测试中优于其他大型开源评估模型,并接近GPT-4水平。相关代码已开源。
- 摘要: 本文展示了如何使用大型语言模型(LLMs)将自然语言中定义的问题类映射成半形式化的规格,以便由推理和学习系统解决问题实例。研究提出了LLM驱动的认知任务分析代理,能够为自然语言指定的任务生成问题空间定义。
- 摘要: 本文提出MoRA方法,通过使用方阵实现高秩更新,以增强大型语言模型在保持参数效率的同时学习和记忆新知识的能力,在五个任务上超越LoRA表现。
- 摘要: 本文提出了一种名为Reindex-Then-Adapt(RTA)的框架,通过将对话推荐系统中的多词项标题转换为单个词项,并调整其概率分布,提高了推荐的准确性。
大模型开源项目
- 摘要: 易采集是一个用JavaScript编写的开源项目,提供了一个可视化界面,用户可以不需要编写代码就能设计和执行网络爬虫任务,实现数据采集和浏览器自动化测试。
- 摘要: AI4Finance-Foundation推出FinGPT,这是一个开源金融领域的大型语言模型。该模型在HuggingFace平台发布,旨在革新金融科技领域。项目代码使用Jupyter Notebook编写。
- 摘要: fabric是一个开源框架,旨在使用AI增强人类能力。它提供了一个模块化的解决方案,通过众包的AI提示集合来解决特定问题,可广泛应用。该项目使用Python语言编写。
- 摘要: rashadphz是一个开源的AI搜索引擎项目,支持自我托管,可与本地或云端大型语言模型(LLMs)联动。该项目使用TypeScript编写。
- 摘要: ngc660sec是一个基于HOOK机制的微信机器人,具备安全新闻推送、查询服务等多项功能,支持积分、自动拉人和广告检测。使用Python开发,易于上手。