超爱玩大模型-CSDN博客

原创每日一看大模型新闻（2024.1.25）下国内首个非Attention大模型发布；让模型「think more steps」更有用；谷歌爆肝7个月祭出AI视频大模型！；澜舟科技孟子大模型开放公众服务

Lumiere解决了视频生成中的真实性、多样化和运动连贯性问题，创新地使用时空U-Net（STU-Net）架构同时在空间和时间维度处理视频，提高了生成视频的连贯性，降低了计算量。研究人员采用了一种新的T2V扩散框架，可以立即生成视频的完整持续时间，实现了以16fps（或5秒）生成80帧的效果，这比大多数使用单一基础模型的媒体要好。：岩山科技旗下的创企岩芯数智（Rock AI）推出了国内首个非Attention机制的大模型Yan，这也是业内少有的非Transformer架构大模型。

2024-03-27 18:00:00 762

原创每日一看大模型新闻（2024.1.25）上上海AI实验室等推出文生3D模型3DTopia-“书生·物华”；红薯智语:小红书AI文案生成器，上传图片直接生成爆款文案；小说 5% 内容由 ChatGP

同时，这也引发了对于使用AI生成内容在文学领域可能涉及的法律和伦理挑战的担忧。这一事件凸显了当代文学面临的技术和道德挑战，以及对于AI在创意领域应用的监管和规范的迫切需求。Lumiere引入了“时空U-Net架构”，一次构建整个视频长度，实现了全局的时间一致性。3DTopia的推理分为两个阶段，第一阶段根据提示词生成粗糙模型的点云格式，第二阶段利用该团队提出的Threefiner方法进行细化，完成上色等操作。此外，该工具强调用户隐私保护，不会收集、存储或使用与上传的图片相关的个人信息。

2024-03-26 17:18:59 472

原创每日一看大模型新闻（2024.1.24）扩散模型更懂复杂提示词！Pika北大斯坦福开源新框架；小红书推出新框架：负样本也能提升大模型的推理能力；爆火《幻兽帕鲁》被指用AI缝合宝可梦，开发者自曝传奇经历

字节跳动旗下的剪辑软件剪映最近开始对克隆音色功能进行小规模测试，大约有10%的用户获得了试用资格，可能在月底会全面推出。然而，关于游戏中角色形象的来源引发了争议，有人质疑开发商可能使用AI洗稿抄袭了宝可梦的形象。然而，由于人才短缺，预计这些芯片的性能将有70%无法得到充分发挥，尤其是在高性能、低功耗的模型优化、神经架构搜索以及为边缘设备调优的领域。：《幻兽帕鲁》是一款迅速爆红的游戏，4天内卖出600万份，最高180万人同时在线，玩家好评率高达93%。此外，福布斯认为，至少这份奇迹更多还是属于人类的奇迹。

2024-03-24 18:00:00 819

原创每日一看大模型新闻（2024.1.23）下腾讯研究院：影响2024年的十大科技应用趋势；GPT-4击败华尔街？最新研究：选股回报超40%；性，谎言和大模型

AI芯片公司寒武纪与生成式AI创企智象未来（HiDream.ai）在北京签署了战略合作协议，双方将通过资源共享、优势互补，在大型模型领域的技术积累基础上，持续进行产品适配，共同推动视觉大型模型的创新和实际应用。这项新服务是一种完全托管和云托管的产品，使企业能够利用Cohere的大语言模型、Meta Llama 2等，并将其与现有系统集成。因此，需加强大模型监管和管理，提高公众认知意识，以更好地利用大模型优势，避免负面影响。：大模型虽提高了工作效率，但也带来隐患，如擦边内容、暴力诱导等。

2024-03-23 18:00:00 502

原创每日一看大模型新闻（2024.1.23）上上海AI实验室：开源发布书生·浦语数学InternLM2-Math；消灭「幻觉」！谷歌全新ASPIRE方法让LLM给自己打分，效果碾压10x体量模型

该应用的开发者王登科表示，他开发这款应用的初衷是因为他和女朋友的一次争吵，他把女朋友想象成一个带有愤怒值进度条的机器人，不同的回复会让愤怒值发生变化。：猎户星空与宁夏希望已签署战略合作协议，双方将在政务服务大模型、公积金大模型、宁夏六特大模型、大模型私有化部署一体机、大模型应用服务平台以及智能机器人产品等领域展开深度合作，共同探索和开拓大语言模型在垂直领域和通用场景的应用。这标志着LLM领域的进步，模型容量并非决定性能的唯一因素，适当的策略调整可以显著提升预测的准确性和自信度。2.1消灭「幻觉」！

2024-03-22 17:39:04 387

原创每日一看大模型新闻（2024.1.19-1.22）零一万物：Yi-VL多模态语言模型上线；Stability AI：推出Stable LM 2 1.6B小语言模型：体积更小、性能更高效；猎豹：猎户星空

中国一汽正在积极探索“GPT+”的大型模型创新范式，GPT-BI不仅是中国一汽的首个大型模型应用案例，也是汽车行业的首个大型模型BI应用。在基于GPT-BI等真实业务场景的探索之后，中国一汽将利用大量高质量数据资产，在“阿里云百炼”一站式大型模型应用开发平台上构建面向研发、制造、售后服务等多领域的垂直大型模型。据称，在全新的多模态基准测试MMMU中，Yi-VL-34B以41.6%的准确率成功超越了一系列多模态大模型，仅次于GPT-4V（55.7%），，同时可以在千元显卡算力上运行。

2024-03-21 17:23:48 841

原创每日一看大模型新闻（2024.1.20-1.21）英伟达新对话QA模型准确度超GPT-4，却遭吐槽：无权重代码意义不大；Llama 2打败GPT-4！Meta让大模型自我奖励自迭代，再证合成数据是LL

基于语音的交互是最受欢迎的方式，而理想智能体应具备高效的数据管理和搜索、工作和生活辅助、个性化服务和推荐、自动化任务规划和完成、情感支持和社交互动等关键功能。研究显示，ChatQA-70B在10个对话QA数据集上的表现优于或接近GPT-3.5-turbo和GPT-4，且不依赖OpenAI的合成数据。此外，还有丰富的海水细节和一个动漫风格的夜晚街道。：Paul Couvert利用ChatGPT创建了一个网站，之后并未进行任何操作，该网站却在搜索引擎上获得了很高的排名，给他带来了约1.33万人民币的月收入。

2024-03-20 17:54:35 1032

原创每日一看大模型新闻（2024.1.19）AIGC时代的「数字生命计划」已启动！；百度：发布视频生成模型UniVG；AI视频可控性高能进化！复刻《黑客帝国》经典镜头只需笔刷

据介绍，当对分辨率为1248×1248的图像进行批量推理时，Vim比成熟的视觉Transformer模型DeiT快2.8倍，并节省了86.8%的GPU内存。同时，超越 2D 虚拟沙盘的 3D 场景建设和能够交互的动作设计更给人们带来了沉浸式的体验。通过使用高质量图像对空间模块进行微调，在不降低运动质量的情况下，将分布转移到更高质量的视频上，克服了高质量视频扩散模型的数据限制。：该内容主要讨论了数字生命的概念，即通过将人类的意识上传到智能终端，以数据的形式永久存储，使人类的思想意识得以脱离躯体而独立存在。

2024-03-19 17:58:16 556

原创每日一看大模型新闻（2024.1.17）书生·浦语2.0大模型开源；已证实混合多个小模型性能比肩GPT3.5；20%的杨幂+80%的泰勒长什么样？小红书风格化AI来了，可兼容SD和ControlNet

FlagEval大语言模型测评榜单1月榜单已发布，本期新增了最近开源的Mistral（MoE模型）、BlueLM、MindSource、SUS-chat-34B、DeepSeek等模型的评测结果，并使用平行测试来增强主观评测的可靠性。这些角色不仅能进行对话，还拥有自己的人格，能够感知所处的不同社交环境，做出相对应的身体动作来表达情感和反应。此外，大模型的应用也带来了研究机遇，如利用大模型进行更多样化的软件测试任务和阶段、应用于更广泛的测试类型和软件、整合先进的提示工程技术以及与传统技术结合。

2024-03-18 17:29:05 1035

原创每日一看大模型新闻（2024.1.16）网易有道：自研RAG引擎QAnything开放下载；开源大模型XVERSE-Long-256K，支持输入25万汉字；对标OpenAI GPT-4，MiniMax

Stability AI发布了30亿参数的代码模型Stable Code 3B，这是此前发布的Stable Code Alpha 3B模型的后续版本，专为代码补全而设计。据介绍，PhotoMaker是一种高效的个性化文本到图像生成方法，它将任意数量的输入ID图像编码为堆栈ID嵌入，以保存ID信息。这意味着GLM系列模型的全家桶能力实现了工业化，开发者和用户可以更轻松地使用GLM-4模型，不再为提示词而担心。同时，智谱AI宣布GLMs个性化智能体定制能力同时上线，基于GLM-4模型，只要登录智谱清言，

2024-03-17 18:00:00 1420 1

原创每日一看大模型新闻（2024.1.15）深挖RLHF潜力，复旦语言和视觉团队创新奖励模型优化，让大模型更对齐；阿里“AI替换万物”框架火爆社区，网友：偶像不需要真人了？；上海AI实验室等联合推出中文医

在GenMedicalEval评测体系的基础上，联合团队对四个通用大模型（GPT-4、文心一言、通义千问和星火大模型）以及三个参数量较小的医疗领域模型（Huatuo2-13B、MING-13B和DoctorGLM-6B）进行了试验性测试。评测结果显示，通用大模型表现出了较为优异的性能，其中GPT-4表现均衡，没有明显的弱项。此外，该团队还揭示了RLHF在大语言模型中的基本框架，并深入分析了PPO算法的内部机制。他们的研究为AI领域的发展提供了重要的理论和实践指导，推动了人工智能技术的不断进步和创新。

2024-03-16 18:00:00 634

原创每日一看大模型新闻（2024.1.13-1.14）大模型恋爱神器！16种MBTI自由定制；精确指出特定事件发生时间！字节&复旦大学多模态大模型解读视频太香了；ChatGPT在亚马逊上「开网店」

LEGO模型的架构包括独立的编码器处理每个模态的输入，并使用适配器将这些特征映射到LLM的嵌入空间。这项工作的目标是模拟人类形成不同MBTI性格的过程，并为人格心理学领域理解和利用大语言模型开辟新的途径。：近期，微博上出现了一个名为@评论罗伯特的“网友”，因其幽默的评论风格和随手拈来的段子受到关注。：大型语言模型（LLM）在AI领域取得显著进展，但模型规模增长带来巨大资源需求，包括计算、内存、能源等。然而，它也经常留下令人匪夷所思的评论，如“没事，割腕用指甲刀就行了”。1.2大模型恋爱神器！

2024-03-15 17:54:04 561

原创每日一看大模型新闻（2024.1.12）首个国产开源MoE大模型来了！性能媲美Llama 2-7B，计算量降低60%；谷歌MIT最新研究证明：高质量数据获取不难，大模型就是归途；为大模型恶补数学

OPPO的目标是为每个人打造有用的大模型及智能体，并开源Agent框架，打造一站式的“智能体开发平台”，支持智能体的高效孵化、托管与应用。该模型采用全新的自研MoE架构，具有更细粒度的专家划分和共享专家设置，提高了模型在不同任务上的准确性和知识获取的针对性。刘军认为，AI技术的突破将在PC、手机、AIoT等所有智能终端产品领域掀起第三次技术革命浪潮，重塑终端体验及产业生态，类似于“小型化和图形化”、“网络化和移动化”给PC产业带来的两次技术变革。：随着生成式AI的发展，科技公司纷纷进军3D生成领域。

2024-03-14 18:08:17 1534

原创每日一看大模型新闻（2024.1.11）2024属于小模型时代？TinyLlama 小模型发布后爆火：参数轻量级，性能重量级！；广告人上手AI作图的那些痛，这个平台真懂了；文心大模型融入荣耀Magic

他们的千亿多模态大模型CPM-Cricket可以对标GPT-3.5的水平，且在公考行测的逻辑推理试题测试中，CPM的总正确率达到63.76%，甚至超过GPT-4的61.88%。星睿大模型具有多模态、语音、数字孪生等三大基础模型，以及多模态感知、NPDS研发、多模态生成、AI DRIVE、NLP语言、数字生命等六大能力模型，支持文生成图、文生成视频、文生成音乐、图生成图、图生成视频等功能。自Poe一年前推出以来，Quora取得了不俗的增长，拥有超过4亿月活跃用户，融资估值为5亿美元。

2024-03-13 17:44:09 1261

原创每日一看大模型新闻（2024.1.10）推出AIGC提示工具，几个字提示玩转SDXL；Mixtral8x7B论文终于来了：架构细节、参数量首次曝光的AI「意图识别」操作系统！；效果超越Gen-2！字节

具体来说，这个版本进行了两个重大的架构更改：将langchain-core分离出来，并将合作伙伴包与langchain分开，放入langchain-community或作为独立的合作伙伴包提供。此外，代码还可以引导LLMs产生结构化的、精确的中间步骤，并通过函数调用与外部执行端连接。：本文介绍了人机交互的变革，特别是荣耀在2023开发者大会上发布的行业首个基于AI意图识别的人机交互（IUI）操作系统——MagicOS 8.0（魔法OS 8.0），以及首个平台级自研7B端侧AI大模型“魔法大模型”。

2024-03-12 17:06:19 601

原创每日一看大模型新闻（2024.1.9）百川智能：发布角色大模型Baichuan-NPC；教育大模型：25道题能测1000个知识点；从Google Gemini到OpenAI Q*：生成式AI研究领域全

通过这一方案，游戏厂商无需编写任何代码，只需通过简单的文字描述，便可以快速构建所需的角色，实现低成本、高效率的角色定制。该模型不仅支持纯文本外的任务，还在知识获取、信息输入及传达信息等方面具备更好的性能，与传统的大语言模型有本质的不同。此外，文章还讨论了AI主题和AI生成的预印本的扩散所带来的新兴学术挑战，并检查了它们对同行评审过程和学术交流的影响。最后，强调了在AI发展中融入伦理和以人为本的方法的重要性，并概述了一个未来AI研究的战略，该战略聚焦于混合专家模型、多模态和通用人工智能的平衡和审慎使用。

2024-03-10 18:00:00 1848

原创每日一看大模型新闻（2024.1.7-1.8中）UCLA 团队提出自我博弈微调方法 SPIN；同济大学与复旦等发布检索增强生成（RAG）综述；大模型无限流式输入推理飙升46%！国产开源加速「全家桶」

在过去的十年中，中国AI相关企业的注册量呈现持续增长的趋势，2020年新增19.43万家，同比增长171.86%，达到了近十年的增速峰值。Colossal-AI团队开源了SwiftInfer，基于TensorRT实现了StreamingLLM，可以进一步提升大模型推理性能46%，为多轮对话推理提供了高效可靠的落地方案。：苹果爆料人马克·古尔曼爆料，苹果公司计划在今年6月的全球开发者大会（WWDC）上推出一系列基于生成式人工智能（AI）的工具，并将这些工具作为即将发布的iOS 18的一部分。

2024-03-09 18:00:00 1090

原创每日一看大模型新闻（2024.1.7-1.8下）阿里推文生3D数字人项目Make-A-Character；400万token上下文、推理再加速46%！OpenAI翁丽莲的Agent公式，一定是正确的吗

具体性能方面，RTX 4080 SUPER比RTX 4080快3-5%，RTX 4070 Ti SUPER比RTX 4070 Ti快15%，RTX 4070 SUPER比RTX 4070快14%。HR-Pro包括两个可靠性感知的阶段，能够有效地从片段级别和实例级别的点标注中传播高置信度的线索，从而使网络能够学习到更具区分性的片段表示和更可靠的提议。AnyText对生成文字的把控可媲美专业PS，用户可自定义规划文字出现的位置，图片的强度、力度、种子数等，目前在Github超2，400颗星非常受欢迎。

2024-03-08 18:00:00 3512

原创每日一看大模型新闻（2024.1.6-1.8上）微软祭出代码大模型WaveCoder！4项代码任务2万个实例数据集，让LLM泛化能力飙升；专补大模型短板的RAG有哪些新进展？这篇综述讲明白了

此外，作者团队还利用一致性蒸馏技术得到了VideoLCM模型，可以生成高保真的视频，提升了视频生成的效率。，例如运行大模型的碳成本很高，私人人工智能投资首次下降，工业界在开发新的机器学习模型方面领先于学术界等。相较于其他利用音频的TSG工作，ADPN方法在音频模态方面取得了显著的性能提升，并在多项测试中获得了新的SOTA结果。同时，为开发者提供了参考，帮助辨识不同技术的优缺点，并指导如何在多样化的应用场景中最有效地利用这些技术。这些近来的研究都体现了，指令调优在提高大模型性能方面，展现出强大的潜力。

2024-03-07 17:25:01 1236

原创每日一看大模型新闻（2024.1.5）千元成本搞定专业大模型，系统优化+开源大模型是关键；小冰正式发布克隆人：已经有人拿它年入100万了！；腾讯推出语音识别大模型；上海：组建大模型语料数据联盟

在大模型元年，由于技术特性，大模型的算力需求翻倍增长。此外，美图公司还正式向行业客户和合作伙伴全面开放了MiracleVision的模型能力，通过API、SDK、SaaS、模型训练等形式，持续助力多场景工作流，帮助企业降低成本并提高效率。：腾讯云ASR最新升级增强了方言处理、噪声过滤和语义识别能力，使用大语言模型LLM，上下文语义和大数据提取意图，增强对读音相似词和专业术语的准确识别。此外，他们还推出了Colossal-AI大模型的分布式部署优化系统，目标是降低AI大模型具体落地的门槛和成本。

2024-03-06 17:39:00 1201

原创每日一看大模型新闻（2024.1.4）中国AIGC广告营销产业全景报告：五大变革四大影响；马斯克也逃不过「科目三」，阿里这个应用都要把外国人馋哭了；通义千问：上线图生视频功能

对于创业公司而言，这也是一个难得的机遇，可以通过创新应用生成式AI技术，打造更具竞争力的广告营销产品和服务。大模型和生成式AI技术在广告营销行业的应用日益广泛，从广告脚本生成、个性化广告推送，到赋能企业营销全流程，都呈现出前所未有的火热态势。：小冰公司宣布，他们去年12月成功获得了“小冰大模型”国内备案，实现了不同参数规模和用途的自研大模型产品的落地，并部分完成了新范式商业化验证。在科技创新领域，将以科学数据支持大模型开发，建设高质量语料库和基础科学数据集，以支持AI大模型的开发和训练。

2024-03-05 09:34:10 1112

原创每日一看大模型新闻（2024.1.2-1.3）同花顺：问财大模型内测申请开启；高情商的NPC来了，刚伸出手，它就做好了要配合下一步动作的准备；ChatGPT文明模拟器再上线，一键穿越回火山爆发当天的庞

IDC预测，到2024年，全球将涌现出超过5亿个新应用，相当于过去40年间出现的应用总和。在新的基准测试中，WikiChat获得了97.3%的事实准确性，相比之下，GPT-4的得分仅为66.1%。最后，作者将基于GPT-4的WikiChat提炼成7B参数的LLaMA，这个模型在事实准确性方面仍然能拿到91.1%的高分，并且运行速度提高了6.5倍，能效更好，可以本地部署。：摩根大通发布了DocLLM，一款专为多模态文档理解设计的生成式语言模型，通过轻量级扩展LLM，避免昂贵的图像编码器，以提高文档分析效能。

2024-02-29 18:00:00 1962

原创每日一看大模型新闻（2023.12.30-1.2）《我的世界》化身AI小镇，NPC居民角色扮演如同真人；大模型幻觉问题无解？理论证明校准的LM必然会出现幻觉；年度最热AI应用TOP 50，除了Chat

此外，报告还揭示了一些令人意外的数据，如AI工具的平均单次使用时长为12分34秒等。此外，该研究还给出了幻觉率的下限，反映了不同类型的事实产生幻觉的速率。它基于扩散模型开发，采用了分模块的方式来生成文字并嵌入到图像中，以提高书写精度和文字与背景的一致性。同时，AnyText的部署方式和对比测试结果，展示了它在文字准确度和图像生成方面的优势。在与环境的交互过程中，LARP 具有一个可学习的动作空间，：该研究表示开放世界游戏给语言智能体带来了新的挑战，如完成复杂的任务、连贯的故事情节和多样化的 NPC 行为。

2024-02-27 18:00:00 1028

原创每日一看大模型新闻（2023.12.29）Spiritme AI:手机拍5分钟视频即可克隆一个虚拟的你；字节用大规模视频数据训练GR-1；ChatGPT个性化重磅升级；未来的关键技能不是提示工程，而是

OpenAI正在开发让ChatGPT更具「个性化」的新功能，包括更连贯的对话、不断改进和自定义记忆。此外，OpenAI还计划推出「临时聊天」功能，该功能将信息仅在当前的聊天窗口中使用，不会被保存在聊天历史中。这些新功能将在GPT商店中展示，并为用户提供更多选择。：一位OpenAI员工在社交媒体上表示，未来的关键技能不是提示工程，而是阅读、写作和口语。支持自动编写视频对话或旁白，根据用户提供的信息，简化视频制作过程，只需两次点击操作。实验证明，GR-1在未见过的场景和物体的表现也大幅领先现有方法。

2024-02-26 18:08:07 569

原创每日一看大模型新闻（2023.12.28）发现GPT-4 API存在重大漏洞；告别冷启动，LoRA为大模型提速高达300%；发布中文大模型基准测评年度报告；腾讯云AI绘画首批通过AIGC绘画平台评估

其中包括OpenAI与微软的合作持续、Meta Llama改变了竞争态势、GPT-4的发布、3万多人联名呼吁暂停AI模型训练、AI Agent的兴起、美国总统拜登签署的AI行政命令和欧盟的AI法案、GitHub Copilot付费用户超过100万、多模态技术的兴起、OpenAI CEO萨姆·阿尔特曼（Sam Altman）在感恩节面临的压力，以及等待谷歌Gemini。此前，马斯克在接受采访时表示，人工智能带来的危险已经迫在眉睫，他认为在未来5年内，人类可能会被人工智能超越。

2024-02-14 18:00:00 1976 1

原创每日一看大模型新闻（2023.12.27）快手开源KwaiAgents系统性能超越GPT-3.5；深度势能：发布预训练大模型DPA-2；2023网络文学十大关键词发布；澜舟科技发布两款大模型

在文本内容摘要的场景下，200字的首字生成仅需0.2秒，2000字的首字生成仅需2.9秒，而摘要字数上限可达14000字，是其他平台的3.5倍。：最近，深度势能团队向社区发布了预训练大模型DPA-2，并全面开放了基于DPA-2的微调、蒸馏和应用自动化流程。而孟子GPT-Code-6.7B大模型基于开源模型DeepSeek Coder开发，引入了金融行业的数据进行预训练，并使用高质量的任务数据进行了微调，支持中英文两种语言，并兼容100多种编程语言。目前，微软尚未推出iOS版Copilot。

2024-02-13 18:00:00 2196

原创每日一看大模型新闻（12.26下）假扮卧底，骗AI泄露代码拯救人类？斯坦福小哥用GPT-4开发游戏惊呆网友；上海AI实验室开源医疗大模型群“浦医2.0”；“算命”AI：600万人数据训练，可预测健康

在由中国信息通信研究院主办、AI关键技术和应用评测工业和信息化部重点实验室协办的“2024中国信通院ICT深度观察报告会”AI伙伴分论坛上，中国信通院AI研究中心安全与元宇宙部主任石霖正式发布了“AI风险管理体系”。将有更多的AI实践者和AI伦理学家加入董事会，关注AI数据偏见风险，并解决Dr. Joy Buolamwini在新书《揭开AI的面纱》中所讨论的一些主要挑战。鉴于将AI模型分类为高风险以及即将进行第三方审计，董事会将加强对AI和网络安全的教育，以应对日益增加的风险。

2024-02-12 18:00:00 1793

原创每日一看大模型新闻（2023.12.25下-12.26上）视频一键动漫化AI工具火了，武打戏各种招式丝滑转换；OpenAI公布2024年计划，GPT-5要来了！；大模型微调非得依赖人类数据吗？Deep

在首批评估中，SuperCLUE-Auto选择了具有代表性的12个闭源和开源模型进行测试，其中包括多个中文大模型。结果显示，有4个中文大模型在中文汽车场景的表现上超越了GPT-3.5，展现出强劲的实力。未来，京能集团将努力实现算力平台100%绿电运营，计划于2024年一季度上线二期1500P公共算力，并预留2000P以上的算力扩展空间，为北京市建设国际科技创新中心和全球数字经济标杆城市提供支持。总的来说，这项研究表明，具有反馈的自训练是减少对人类数据依赖的一种有潜力的方法。

2024-02-11 18:00:00 1290 1

原创每日一看大模型新闻（2023.12.23-12.25上）李飞飞DeepMind全新「代码链」碾压CoT；2023计算机科学7项重大突破！大模型密集涌现上榜；ChatGPT领衔全球最受欢迎的AI工具

此外，OpenAI还在考虑更长远的问题，如用于通用型人工智能的算力，并已与阿联酋王室成员控制的G42就为一家新芯片合资公司筹集资金进行了讨论。：这一年，ChatGPT 引爆的「百模大战」在国内外科技领域打响，没有一家公司敢在这样一个充满变革机遇的时间窗口松懈。：2023年，计算机科学领域大事件人人都能脱口而出，火遍全网的ChatGPT一系列大模型、AI作画神器Midjourney，AI视频生成Gen-2、Pika飞速迭代。有凝聚力的团队、冷静与紧迫感的恰当结合，以及对目标的超预期承诺，是完成任务的关键。

2024-02-10 18:00:00 701

原创每日一看大模型新闻（2023.12.22）Privado推出开源LLM聊天应用MuroChat；百度：推出文字解谜AI游戏“模问题”；一文说尽「大模型推理」！12家高校机构联合发布150页报告

然而，要想玩好V6，需要重新学习如何提示。不过，需要注意的是，V6的速度更慢、成本更高，但已经进行了一次更新，速度提高了2.7倍。报告还指出，两个模型都存在一定的共性问题，比如空间感知能力不强，复杂OCR和抽象视觉理解不理想，推理过程可能存在不自洽结果，对提示设计的鲁棒性不足等。他强调了空间计算技术趋势，并表示Rokid是OST的坚定信仰者，让人用肉眼去看到真实的世界，是他们的一个底线。此外，论文还深入探讨了基础模型中推理能力未来的潜在方向，并讨论了在推理背景下多模态学习、自主代理和超级对齐的相关性。

2024-02-09 18:00:00 1089

原创每日一看大模型新闻（2023.12.21）用友大易：发布国内首个AI面试解决方案；智源开源新一代多模态基础模型Emu2；一位中国教授使用AI创作科幻小说，荣获全国大奖；微调？开源+共训

该公司的目标是创建一个开放和去中心化的替代方案，挑战现有的云系统（如AWS、Azure和Google Cloud），这对未来的商业和社会将是“至关重要”的。与今年7月发布的第一代“多模态to多模态”Emu模型相比，Emu2采用了更简单的建模框架，并训练了从编码器语义空间重建图像的解码器，将模型规模扩展到37B参数，实现了在模型能力和通用性上的突破。在此基础上，可以用5分钟对模型进行优化，优化后的3D模型几乎接近人工制作的3D模型质量，成功率超过95%。，并建构了20+的通用类岗位模型。

2024-02-08 22:42:12 1475

原创每日一看大模型新闻（2023.12.20下）大模型+搜索构建完整技术栈，百川智能搜索增强给企业定制化下了一剂「猛药」；谷歌发布最重要23个产品时刻，其中15个有关AI；微软Azure发布GPT-RAG

通过引入新的视觉-语言模型，PixelLLM为实现更精确的视觉-语言对齐和定位提供了新的可能性。VideoPoet的优势在于利用了现有的大型语言模型进行改进，使用了T5的编码器。：微软Azure最近推出了GPT-RAG，为大型语言模型提供超智能解决方案，确保在企业中更顺畅地运行，旨在满足对LLMs的需求。，包括“智能问诊系统”、“个性化健康管理顾问”、“慢性病管理计划”、“心理健康指导师”、“医学知识库和技能培训平台”、“辅助诊疗助手”、“患教内容智创平台”，覆盖健康管理服务的各个场景应用。

2024-02-05 18:00:00 971

原创每日一看大模型新闻（2023.12.20上）AI把OpenAI内斗魔改成晋江文学，插图也能画；微软把DALL-E 3集成到键盘，任何APP中都可生图；百度智能云：千帆AppBuilder开放服务

FlagEval大语言模型测评榜单12月榜发布，新增大语言模型鲁棒性评测结果，FlagEval平台更新了C-SEM v2.0数据集评测结果，新增了Qwen-72B/1.8B、DeepSeek-67B（Base）模型评测。他指出，AI原生应用的发展需要大模型、智能算力和新的开发生态相互支持，数据积累是关键，预计2024年将诞生更多出色的AI原生应用。TomTom表示，这款语音助手可以集成到其他汽车信息娱乐系统中，也可以作为TomTom数字驾驶舱的内置功能，是一个开放的模块化车载信息娱乐平台。

2024-02-04 18:00:00 1135

原创每日一看大模型新闻（2023.12.19）Kyligence发布数据和分析领域大模型司南；OpenAI发布GPT-4使用指南，提供六大策略；OpenAI公布ChatGPT安全框架，跟踪风险并建立严格

元象宣布开源XVERSE-65B-2底座版，XVERSE-65B-2通过综合优化器状态和学习率策略进行Continual Pre-Training，总训练token量达3.2万亿。模型支持40多种语言，上下文窗口为16K，在六个维度11项标准中八成超越GPT3.5。，是国内最早开源的650亿参数免费商用模型。，为生态贡献“文理兼修、大有可为”的大模型。：UIUC和清华合作推出的Magicoder，在代码生成领域以不到7B参数媲美顶级模型，并全面开源其代码、权重和数据。

2024-02-03 18:00:00 2556 1

原创每日一看大模型新闻（2023.12.18）OpenAI官方的Prompt工程指南：你可以这么玩ChatGPT；有效提高视频编辑一致性，美图&国科大提出基于文生图模型新方法EI²；openAI灰度测试

在这方面的研究初期，视频生成和编辑任务利用文本-视频数据集直接训练文生视频模型实现目标，但缺少高质量的视频数据，泛化能力通常较差，并且需要耗费大量的计算资源。为了避免这些问题，近期工作倾向于将基于大规模数据集上预训练的文生图模型拓展到视频领域，并通过引入可学习的时序模块使文生图模型具备视频生成和编辑能力。：第一要写清楚指令，包含详细查询信息，提供示例，并指定步骤和输出长度。HAI提供多种预装模型环境，支持自定义部署最新的开源模型，通过可视化界面为开发者提供友好的图形化交互视图，支持多种算力连接方式。

2024-02-02 18:00:00 1852

原创每日一看大模型新闻（2023.12.15-12.17）3D、视频直接扔进对话框，大模型掌握跨模态推理；PaLM 2数学性能暴涨6%！DeepMind新作力证「合成数据」是通往AGI关键；OpenAI：

与之前的英特尔酷睿i7-1370P相比，它的功耗降低了25%，比AMD的Ryzen 7 7840U的功耗降低了79%。该框架通过一个冻结的预训练编码器对文本指令进行token化，对非文本输入进行嵌入化，然后通过Q-Former对这些查询嵌入进行变换，最终通过一个可训练的线性层将修改后的查询嵌入投影到冻结LLM的嵌入空间。微软采取多元化策略，拓展AI模型库，不仅提供与OpenAI合作的模型，还引入竞争对手的开源模型，满足不同客户需求。：合成数据是大模型的未来，可以提供高质量的训练token。

2024-02-01 18:00:00 933

原创每日一看大模型新闻（2023.12.14）谷歌DeepMind最先进Imagen 2发布：这些AI图片你能辨别吗？；全国首个古籍大语言模型“荀子”发布；首个「创造式任务」基准来了！北大清华联手发布

此外，作者还提出了两种不同的评价方式，验证了GPT-4V评价指标与人类评价的一致性。总体来说，这项研究是对开放式智能体的创造性研究的重要尝试，为后续相关领域的研究提供了基准，也为实现通用人工智能提供了重要思路。FunSearch的工作原理是将预先训练好的大模型（LLM）与自动“评估器”配对使用，前者的目标是以计算机代码的形式提供创造性的解决方案，后者则负责防止出现幻觉和不正确的想法。总的来说，谷歌的Imagen 2在图像生成领域取得了显著的进展，为用户提供了更高质量、更灵活和更安全的图像生成体验。

2024-01-31 18:00:00 693

原创每日一看大模型新闻（2023.12.13）趣味项目CLoT:训练LLM更幽默地回答问题；用RLHF 2%的算力让LLM停止有害输出，字节提出LLM遗忘学习；2.7B能打Llama 2 70B，微软祭出

在本科期间，顾晓韬曾在清华大学知识工程实验室进行科研实习，师从智谱AI的创始人唐杰，从事数据挖掘和模型训练等相关研究。Ray-Ban Meta智能眼镜是今年9月推出的首款内置Meta AI的智能眼镜，搭载高通骁龙AR1 Gen 1芯片，配备1200万像素摄像头，支持1080P 60fps格式的视频录制和高分辨率照片拍摄。OpenAI推出了GPTs，颠覆了先前的GPT模型，并通过引入董事会吸引了大量关注。CLoT显著提高了大语言模型（LLM）在多种Oogiri游戏中的幽默表现，展现了卓越的创造性和泛化能力。

2024-01-30 18:00:00 1289

原创每日一看大模型新闻（2023.12.11-12.12）智谱AI推出中文大模型对齐评测基准AlignBench；OpenAI首席科学家论文获NeurIPS时间检验奖；2024年AI趋势看这张图

由于像OpenAI和Google这样的公司变得越来越封闭，开源社区及其企业支持者Meta似乎正在缩小与专有模型的差距，使得生成式AI的访问更为民主化，这可能构成对专有模型商业模式的挑战。此前，曾向零一万物官方发邮件建议修改张量名称的Eric Hartford也在社交平台X上为其澄清，称零一万物“没有在任何事情上撒谎，他们从零开始使用自己创建的数据集训练Yi，对开源领域的贡献是值得赞扬的”。在全局方面，无需训练，它引入了流引导的递归潜传播模块，通过在整个序列中传播和融合潜信息来增强视频的整体稳定性。

2024-01-29 16:51:44 1103

原创每日一看大模型新闻（2023.12.08-12.10）通义千问（预训练模型）登顶Hugging Face开源大模型榜首；首个开源MoE大模型发布！7Bx8个专家，离GPT-4最近的一集；

全球最大的开源大模型社区Hugging Face最近发布了最新的开源大模型排行榜，当模型类型为pretrained（预训练模型）时，通义千问位居榜首。Hugging Face的开源大模型排行榜是目前大模型领域中最具权威性的榜单之一，收录了全球上百个开源大模型，并对阅读理解、逻辑推理、数学计算、事实问答等六个方面进行了测试评估。宇树还发布了首款“通用人形机器人H1”，其搭载2个英特尔酷睿i7 1265U，配备3D激光雷达 + 深度相机，还可选配灵巧手，展现了出色的硬件配置和先进的感知技术。

2024-01-28 18:00:00 672

空空如也

空空如也