大模型日报-20240118

微软TaskWeaver开源框架:携手数据分析与行业定制,打造顶级Agent解决方案

链接:https://news.miracleplus.com/share_link/15912

在这里插入图片描述
数据分析一直是现代社会中的重要工具,它帮助我们洞察本质、发现规律并指导决策。然而,数据分析过程往往复杂且费时,因此我们期望存在一个智能助手助力用户直接 “与数据对话 “。得益于大语言模型(LLM)的发展,虚拟助手和 Copilot 等智能 Agent 纷纷涌现,它们在自然语言理解和生成方面的表现令人叹为观止。但遗憾的是,在处理复杂数据结构(如 DataFrame, ndarray 等)和引入领域知识方面,现有的 Agent 框架仍然举步维艰,而这恰恰是数据分析和专业领域中的核心需求。为了突破这一瓶颈,微软推出了 TaskWeaver—— 一款代码优先的 Agent 框架。TaskWeaver 能够将用户的自然语言请求巧妙地转化为可执行代码,并支持丰富的数据结构、动态插件选择以及专业领域适应的规划过程。

在24项场景中优于人类医生,Google团队开发基于自博弈的诊断对话大模型

在这里插入图片描述
链接:https://news.miracleplus.com/share_link/15915

医学的核心在于医患对话,熟练的病史采集为准确的诊断、有效的管理和持久的信任铺平了道路。能够进行诊断对话的人工智能(AI)系统可以提高护理的可及性、一致性和质量。然而,学习临床医生的专业知识是一个巨大的挑战。Google Research 和 Google DeepMind 的 AI 团队开发了 AMIE(Articulate Medical Intelligence Explorer),这是一种基于大型语言模型(LLM)的人工智能系统,针对诊断对话进行了优化。AMIE 使用一种新颖的基于自博弈(self-play)的模拟环境,具有自动反馈机制,可在不同的疾病状况、专业和背景下扩展学习。「据我们所知,这是第一次针对诊断对话和获取临床病史进行最佳设计的对话式人工智能系统。」 Google Health 的临床研究科学家、论文的合著者 Alan Karthikesalingam 说道。

上海人工智能实验室团队开发具有多核光纤单元旋转功能的AI驱动投影断层扫描

在这里插入图片描述
链接:https://news.miracleplus.com/share_link/15916
光学断层扫描已成为一种非侵入性成像方法,可提供对亚细胞结构的三维洞察,从而能够更深入地了解细胞功能、相互作用和过程。传统的光学断层扫描方法受到有限的照明扫描范围的限制,导致分辨率各向异性和细胞结构的不完整成像。为了克服这个问题,上海人工智能实验室、德国德累斯顿工业大学(Technische Universität Dresden)以及马克斯·普朗克学会(Max Planck Society)的研究人员采用了紧凑的多核光纤细胞旋转器系统,该系统有助于对微流控芯片内的细胞进行精确的光学操纵,从而实现具有各向同性分辨率的全角度投影断层扫描。此外,研究人员展示了人工智能驱动的断层扫描重建工作流程,它可以是从通常需要手动处理的传统计算方法到完全自主过程的范式转变。所提出的细胞旋转断层扫描方法的性能通过细胞模型和 HL60 人类癌细胞的三维重建得到验证。

微软Copilot大会员来了:每月20刀,人人都能用

在这里插入图片描述
链接:https://news.miracleplus.com/share_link/15917

去年 9 月,微软宣布了大模型 Copilot 能力加入 Office 和 Windows 11 的新计划。今天,该能力终于覆盖到了全体用户。1 月 15 日,微软正式发布 Copilot Pro,其每月订阅费用为 20 美元,可解锁访问 Word、Excel 和 PowerPoint 等 Office 常用办公软件中的大模型能力,同时优先访问最新的 OpenAI 模型。在其之上,你也可以基于需求构建起属于自己的 Copilot GPT。

智谱发布GLM-4全家桶:性能提升60%,多模态、128K长文本,全能All Tools及GPTs商店

在这里插入图片描述
链接:https://news.miracleplus.com/share_link/15918

国产大模型玩家智谱AI,交出最新成绩单——发布全自研第四代基座大模型GLM-4,且所有更新迭代的能力全量上线。作为国内唯一一个产品线全对标OpenAI的大模型公司,智谱年前攒了波大的:按官方说法,GLM-4性能相比GLM-3提升60%,逼近GPT-4。而同时推出的GLM-4-All Tools,能够完成用户意图理解-复杂指令规划-自由调用GLM生态的多种模型能力。值得一提的是,智谱发布了GLMs,为所有开发者提供AI智能体定制能力,简单prompt指令就能创建个性化GLM智能体。

MiniMax 国内首个 MoE 大语言模型全量上线啦

在这里插入图片描述
链接:https://news.miracleplus.com/share_link/15919

今天,经过了半个月的部分客户的内测和反馈,MiniMax 全量发布大语言模型 abab6,为国内首个 MoE 大语言模型。在 MoE 结构下,abab6 拥有大参数带来的处理复杂任务的能力,同时模型在单位时间内能够训练足够多的数据,计算效率也可以得到大幅提升。改进了 abab5.5 在处理更复杂、对模型输出有更精细要求场景中出现的问题。

开源模型新纪录:超越Mixtral 8x7B Instruct的模型来了

在这里插入图片描述

链接:https://news.miracleplus.com/share_link/15920

从 Llama、Llama 2 到 Mixtral 8x7B,开源模型的性能记录一直在被刷新。由于 Mistral 8x7B 在大多数基准测试中都优于 Llama 2 70B 和 GPT-3.5,因此它也被认为是一种「非常接近 GPT-4」的开源选项。在前段时间的一篇论文中,该模型背后的公司 Mistral AI 公布了 Mixtral 8x7B 的一些技术细节,并推出了 Mixtral 8x7B – Instruct 聊天模型。该模型性能在人类评估基准上明显超过了 GPT-3.5 Turbo、Claude-2.1、Gemini Pro 和 Llama 2 70B 聊天模型。在 BBQ 和 BOLD 等基准中,Mixtral - Instruct 也显示出更少的偏见。但最近,Mixtral Instruct 也被超越了。一家名叫 Nous Research 的公司宣布,他们基于 Mixtral 8x7B 训练的新模型 ——Nous-Hermes-2 Mixtral 8x7B 在很多基准上都超过了 Mixtral Instruct,达到了 SOTA 性能。

MAGNeT:一个单一的非自回归模型,用于文本到音乐和文本到声音的生成,质量与SOTA模型相当,同时速度提高7倍

链接:https://news.miracleplus.com/share_link/15923
很高兴分享MAGNeT 🧲!
https://pages.cs.huji.ac.il/adiyoss-lab/MAGNeT/
一个单一的非自回归模型,用于文本到音乐和文本到声音的生成,质量与SOTA模型相当,同时速度提高7倍。我们在audiocraft上开源了我们的代码(包括训练)!还有一个Gradio演示。

Mixtral 8x7B模型上线,Teknium:据我所知,这是第一个击败MistralAI的Mixtral Instruct模型的Mixtral基础模型

在这里插入图片描述
链接:https://news.miracleplus.com/share_link/15924

Teknium:终于到了这个时刻!我们的Mixtral 8x7B模型现在已经上线并可用了!

Nous-Hermes-2 Mixtral 8x7B有两种变体,一个是SFT+DPO和仅SFT,所以你可以尝试看看哪个对你更有效!

据我所知,这是第一个击败@MistralAI的Mixtral Instruct模型的Mixtral基础模型,在我自己的个人测试中,它可能是目前最好的开源LLM(大型语言模型)!

LLM幻觉检测:提升聊天机器人的可信度

链接:https://news.miracleplus.com/share_link/15929

探讨如何避免大型语言模型(LLM)在生成回复时产生幻觉或非事实陈述。介绍几种方法,包括调整温度参数、使用余弦距离和BERTScore进行相似度评估,以及自然语言推理(NLI)来检测输出的一致性。特别强调了LLM自相似性得分作为实时幻觉检测的有效方法,并展示了如何通过Streamlit构建一个实时幻觉检测的聊天机器人应用。这些方法有助于提高聊天机器人的输出质量,增强用户信任。

神经网络在余震强度预测中的突破

链接:https://news.miracleplus.com/share_link/15930

基于神经网络的地震余震强度预测模型在Nature杂志上获得认可,其性能超越传统模型。这些模型利用深度学习处理大量地震数据,提高了预测余震发生概率和震级范围的准确性。美国地质勘探局(USGS)的标准模型与神经点过程模型(neural-temporal point processes)相比,后者在捕捉地震复杂规律方面表现更佳。此外,智能地动系统利用AI技术实现了地震信息的实时自动检测与发布,展示了AI在地震预警领域的实际应用和潜力。这些进展表明,AI技术在提升自然灾害应对能力方面正发挥着越来越重要的作用。

AI模型与工具的开源进展

链接:https://news.miracleplus.com/share_link/15931

本周,机器之心SOTA模型平台发布了多个开源项目,包括8个基础模型/精调模型,覆盖中文对话、多轮对话、金融投资、医学对话等领域。此外,还有1个Agent开发工具,旨在提升Agent效率,以及1个必备工具,专为Mistral模型的快速推理设计。这些开源资源为AI研究和应用提供了新的工具和模型,有助于推动AI技术的进一步发展和行业应用。

.NET应用迁移到Azure的新工具

链接:https://news.miracleplus.com/share_link/15932

微软发布的Azure Migrate应用程序和.NET代码评估工具(AppCAT),旨在帮助开发者评估和迁移本地.NET应用程序到Azure云平台。AppCAT通过静态代码分析,识别迁移过程中的潜在问题,并提供修复建议。工具支持Visual Studio扩展和.NET CLI两种形式,能够生成详细的分析报告,帮助开发者评估迁移工作量和项目组件。未来计划包括集成AI功能和与Copilot的集成,以及根据Azure目标提供更精确的评估。鼓励开发者通过Visual Studio反馈渠道提供反馈,共同完善工具。

给科研人的 ML 开源发布工具包

链接:https://news.miracleplus.com/share_link/15933

指南介绍Hugging Face提供的ML开源发布工具包,旨在帮助科研人员将研究成果(包括论文、代码、数据集、模型等)公开发布,以增加研究的可见度和应用。分享如何使用arXiv、GitHub和Hugging Face Hub等平台进行发布,以及创建在线演示Space。强调开源的重要性,包括促进研究合作、推动领域发展和提高成果的可访问性。提供详细的步骤和工具使用指南,以及如何通过社交媒体和社区互动来推广研究成果。鼓励科研人员参与开源,共同推动AI领域的进步。

X-AnyLabeling v2.3.0发布

链接:https://news.miracleplus.com/share_link/15934

X-AnyLabeling v2.3.0,一款开源AI标注工具,支持多样化标注需求,集成YOLOv8、EdgeSAM等热门模型,提供一键导入导出功能,支持CPU/GPU加速,跨平台兼容。新版本增强了易用性,如标签背景高亮、数据统计预览等。工具支持视频标注,集成先进跟踪算法,提升标注效率。社区提供详细文档和支持,鼓励用户参与改进。展望未来,X-AnyLabeling将继续优化,满足更多业务场景。

RAG技术与Elasticsearch应用

链接:https://news.miracleplus.com/share_link/15935

检索增强生成(RAG)技术,这是一种结合检索和生成的方法,有效解决了大语言模型(LLM)的知识限制和幻觉问题。通过部署Elasticsearch(ES)并利用其向量检索功能,我们能够将文档向量化并存储,从而在问题提出时检索相关文档,为LLM提供上下文信息。此外,我们将介绍如何使用LlamaIndex框架结合ES进行文档索引和检索,以及如何自定义Embedding模型以实现文本向量化。最后,我们将展示如何利用RAG技术进行问题检索和内容生成,以及在不使用LLM的情况下,如何仅基于检索到的文档生成提示词模板。

京东AIGC与知识图谱结合实践

链接:https://news.miracleplus.com/share_link/15936

嘉宾分享了京东如何结合知识图谱与AIGC技术,提升电商场景下的商品文案自动生成质量。通过利用商品的多源输入信息,包括图片、文本和知识图谱,京东开发了一套系统,该系统能够提取商品卖点和要素,并通过编码器和解码器处理这些信息。此外,京东还引入了句间流畅度模型和标点纠错模型,以增强文案的连贯性和准确性。嘉宾还提到了如何通过领域和通用知识图谱的结合,以及大模型的探索,来提升文案的丰富度和可信度。这些技术的应用不仅提高了文案的生成效率,还显著降低了成本,提高了转化率。

  • 19
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值