自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(58)
  • 收藏
  • 关注

原创 ChatGPT的高级语音功能“Her”终于上线啦!!

在OpenAI演示后不久,约翰逊表示她曾多次拒绝OpenAI CEO山姆·奥特曼关于使用她声音的请求,在看到GPT-4o的演示后,她聘请了法律顾问为自己的声音辩护。今年1月,人工智能初创公司ElevenLabs的语音克隆技术被用来冒充美国总统拜登,欺骗了新罕布什尔州的初选选民,引发了不小的争议。今年5月,OpenAI首次展示了GPT-4o的语音功能,“她”的反应速度和与真人声音的惊人相似度震惊了观众——问题就出在这儿。而GPT-4o是多模态的,能够在没有辅助模型的情况下处理这些任务,从而显著降低对话延迟。

2024-07-31 19:53:42 1238

原创 SearchGPT的初次评测出炉:响应迅速且无广告,被誉为“OpenAI的王牌”

OpenAI此次推出的SearchGPT引起了广泛关注——最新发布的SearchGPT已经迎来了第一批用户的体验分享。根据测试者的反馈,尤其是在与其他工具的对比中,有用户表示其速度快得令人难以置信,并希望在开放使用后依然能保持这种速度。言下之意是,目前的高速度可能是由于使用人数较少。尽管如此,这款新产品仍然受到了不少人的赞扬,有人称其为OpenAI的杀手级应用。一些网友甚至开始为SearchGPT的竞争对手担忧,猜测谷歌可能会因此感到压力。

2024-07-28 23:23:33 1484

原创 OpenAI的《Her》为何迟迟未能面世?

这一细节暴露了视频通话部分的延迟问题:语音部分的问题已经处理完毕,而视觉部分还在处理之前的镜头,即手机刚被拿起时摄像头拍到的木桌。5月14日,OpenAI发布了GPT-4o及其端到端实时音视频对话模式,现场演示展示了AI对话的流畅度,几乎与人类无异。信号采集与预处理:在端侧设备(如手机)上采集用户的语音信号,并进行降噪和回声消除等预处理,为后续的语音识别做好准备。该系统能够感知用户的呼吸节奏,并以更为丰富的语气实时回复,甚至可以在对话中随时打断AI,效果令人惊艳。没体验过OpenAI最新版GPT-4o?

2024-07-27 19:21:59 780

原创 GPT-4o Mini登顶大模型竞技场,奥特曼:两个月内微调免费

近日,版迎来了“高光时刻”——它在lmsys大模型竞技场中登顶,与满血版并列第一不同于一般的数据集测评,大模型竞技场是用户自己出题、用脚投票的结果,无法通过“刷题”来走捷径,因此更为真实。这个成绩一出,连CEO奥特曼都激动起来了:面对评估成绩,我们本来是尽量矜持的,但是看到GPT-4o Mini表现和满血版一样,价格却只有1/20,内心还是很激动。网友看到之后表示OK,但更关心的还是GPT-4o发布会上演示的“Her”到底啥时候上线。

2024-07-26 16:09:30 1166

原创 OpenAI深夜发布 SearchGPT:进军大模型搜索领域,挑战谷歌与 Perplexity!

目前,OpenAI 正在测试 SearchGPT,它能够通过清晰且相关的来源为用户提供快速、及时的答案。与 SearchGPT 一起,还推出了一种让提供方管理内容在 SearchGPT 中的显示方式的方法。在一个官方示例中,搜索引擎总结了关于一场音乐节的发现,然后提供了活动的简短描述,后面是归因链接。近期,AI 领域竞争愈发激烈,不仅大模型发布频繁,还不断带来新的产品体验。但 SearchGPT 并不是返回简单的链接列表,而是尝试组织和理解它们。SearchGPT 的搜索从一个大文本框开始,询问用户“。

2024-07-26 15:27:40 690

原创 AI慢思考蒸馏进快思考,Llama2跃升至GPT-4水平,不写过程也能做对题

一致性筛选:对每个输入样本,使用系统2模型采样生成多个输出,然后通过多数投票等方法进行比较,如果大多数输出一致,则认为该输出是可靠的;研究人员通过将AI的“慢思考”结果蒸馏进“快思考”,使Llama2的表现提升了257%,甚至超越了GPT-4,同时还降低了推理成本。这样就得到了输入-系统2输出的数据对,可以视为一种无监督的“伪标签”,将这些数据对收集起来,就形成初步的蒸馏数据集。系统2则是慢速、有意识的推理,准确性更高。Meta所做的“蒸馏”,就是用系统2生成数据,然后对用系统1推理的模型进行微调。

2024-07-15 23:39:54 1209

原创 6700万参数模型媲美GPT-4!微软与MIT等机构联手破解Transformer推理奥秘

在所有评估设置中,公理化训练模型TS2(NoPE)的性能明显优于随机基线,即使因果链的长度超过其训练数据。特别是,尽管模型没有在完全反转的链上进行训练,但其表现与规模更大的GPT-4模型相当(图 2)。在其他任务中,其准确性往往优于或与Gemini Pro、Phi-3等十亿参数规模的模型相当。这些结果表明,经过公理训练的模型可以从简单因果序列的演示中学会推理更复杂的因果结构,展示了公理训练在因果图推理方面的潜力。

2024-07-14 23:59:16 919

原创 机器人比你还会做法?!

从人体损耗来看,AI大厨只用了33个动作,就完成了人类需要298个动作才能完成的任务,明显更省力。桌上摆着两份相同的食材,双方需要炒同样的三道菜:XO酱笋炒海螺、小炒黄牛肉、辣椒炒肉。此外,在另两项指标上,机器人的出餐速度是人类大厨的3倍,因为它可以同时操作三台机器。最近,一款名为「美膳狮」的AI炒菜机器人,向湘菜大师杨孙师傅发起了PK——有位路人坚信右边的菜是人类做的,但实际上那是机器人的作品。令人惊讶的是,仅仅1分半钟,机器人的第一道菜就出锅了!由此看来,中国的餐饮后厨,或许正在迈入AI机器人时代。

2024-07-11 23:23:33 674

原创 TTT架构超越Transformer,ML模型替代RNN隐藏状态!

一种崭新的大语言模型(LLM)架构有望取代当前主导 AI 领域的 Transformer,并在性能上超越 Mamba。本周一,关于 Test-Time Training(TTT)的研究论文在人工智能社区引发了广泛讨论。该研究由斯坦福大学、加州大学伯克利分校、加州大学圣迭戈分校和 Meta 的研究人员共同完成。他们设计了一个新架构 TTT,利用机器学习模型取代了 RNN 的隐藏状态。通过输入 token 的梯度下降,该模型能够压缩上下文。

2024-07-10 21:39:32 1606

原创 【最新版】手把手Claude 3.5 Sonnet 详细步骤注册方法!

Claude 3.5 Sonnet 在研究生水平的推理 (GPQA)、本科生水平的知识 (MMLU) 和编码能力 (HumanEval) 方面树立了新的行业标杆。它在理解细微差别、幽默感和复杂指令方面有显著进步,并且能够以自然、亲切的语气撰写高质量内容,表现尤为出色。尤其值得一提的是,Claude 3.5 Sonnet 的运行速度是 Claude 3 Opus 的两倍。此外,在一次内部代理编码评估中,Claude 3.5 Sonnet 解决了 64% 的问题,明显超过 Claude 3 O

2024-07-09 20:07:33 4386

原创 GPT-4o无法取代程序员! IEEE研究显示,困难编码正确率仅为0.66%!

有了ChatGPT,还需要人类程序员编码吗?上个月,一项发表在IEEE TSE期刊(Transactions on Software Engineering)上的研究评估了ChatGPT生成代码在功能性、复杂性和安全性方面的表现。结果显示,研究人员测试了GPT-3.5在五种编程语言()中,解决LeetCode平台上的728个编码问题和应对18个CWE(常见缺陷枚举)场景的能力。虽然AI在某些情况下能够生成比人类更优质的代码,但分析也揭示了一些AI生成代码的安全性问题。

2024-07-09 18:42:36 2225

原创 不懂数学别想靠GPT-4o实现飞跃!

ChatGPT回答:「是的,你可以使用matplotlib包中的matplotlib.animation模块,在Python中创建多个图形的幻灯片或动画图像。陶哲轩总结道,AI在他的主要数学研究领域帮助有限,但在编码和制作图表等次要任务上大大提高了他的能力,同时提升了他在一般任务中的水平,至少达到了初学者的水准。令人惊讶的是,他发现AI在数学研究中的作用有限,但却大大提高了他在编码和制作图表等次要任务上的效率。例如,他确实有意让初级领域和次级领域之间的山谷在AI的帮助下获得更高的推动力。

2024-07-08 19:48:03 1580

原创 解决GPT-4o耗电难题!DeepMind新算法训练效率提升13倍,能耗降低10倍!

用数学语言描述这个问题,就是从大小为B的“超级batch”𝒟中提取出与学习最相关的子batch ℬ={𝒙𝑖,𝑖∈[1,…,𝑏]}⊂𝒟,过滤比率可以写作𝑓=1−𝑏/𝐵。之前的优先采样(prioritized sampling)使用基于模型的评分函数对每个数据点打分,再按比例采样。JEST则直接对整个子batch评分,再按照batch级别的分数采样。一种直观的启发式方法是直接选择损失值最高的batch,这种方法可称为“硬学习”(hard learner)。

2024-07-07 21:57:40 1225

原创 WAIC:生成式 AI 时代的到来,高通创新未来!

目前,基于骁龙 X 系列平台的 Windows 11 AI PC 已在国内陆续上市,具备许多独特的 AI 功能,如通过回顾功能对存储资料进行 AI 搜索、设备端的 AI 图像生成与优化、实时翻译字幕和背景滤镜等。几个月后,这一预告变成了现实。,搭载的新型芯片可实现超过 40 TOPS(每秒万亿次操作)的 AI 算力,电池续航时间达一整天,并无缝接入全球最先进的人工智能模型。根据测算,在骁龙 X Elite 的支持下,新一代 AI PC 可以在终端侧运行超过 130 亿参数的生成式 AI 模型。

2024-07-06 19:17:51 827

原创 GPT-4o将改变论文学术文风,科学家揭示5年内百万篇论文“is”“are”词频减少10%!

2023年夏天,他提交了一篇论文初稿,导师给了一些简略的建议和批注,多涉及写作问题。在解决数据问题后,他在万圣节假期前开始了研究,并在几周内得出了初步结果:ChatGPT 出现后,学术论文中一些词语的使用频率确实发生了变化。接着,他通过 ChatGPT API 修改2022年 arXiv 上的前两万篇论文摘要,分析 ChatGPT 的词语偏好。研究显示,如“significant”的词频几乎翻倍,而“is”和“are”的词频减少了约10%。同时,对于不同类别和混合比例的摘要,词语选取也应有所不同。

2024-07-05 19:26:35 952

原创 8人团队历时半年打造开源版GPT-4o,零延迟演示引爆全网!人人可免费使用!

由法国8人团队开发的原生多模态Moshi现场演示几乎没有延迟,吸引了大量AI专家的关注。令人惊讶的是,来得如此之快!昨晚,来自法国AI实验室kyutai的团队展示了首个实时原生多模态Moshi,效果媲美5月发布的GPT-4o。例如,在一个演示中,Moshi作为助手帮助Alexa小哥进行太空探索,让人仿佛置身《流浪地球》中的Moss情景。

2024-07-04 19:39:48 1126

原创 CTO透露GPT-5内幕,OpenAI 以36亿美元收购数据库初创公司

虽然GPT-4的视频通话功能尚未全面推广,但OpenAI的CTO已经对即将到来的GPT-5给出了新的暗示。不久前,Mira回到母校达特茅斯工程学院,并接受了采访。在访谈中,Mira对各代GPT模型的表现进行了评价。目前,OpenAI的目标是让下一代模型(可能是GPT-5)在特定任务上达到博士水平。

2024-07-03 19:50:06 1258

原创 GPT-4o不仅能写代码,还能自查Bug,程序员替代进程再进一步!

随着人工智能(AI)技术不断进步,AI在编程领域的应用取得了显著的成果。通过使用自然语言处理(NLP)和机器学习(ML)技术,AI可以自动生成代码、检测错误并优化性能。一个例子是OpenAI的Codex模型,它可以根据自然语言描述生成相应的代码片段,极大地提高了编程效率。

2024-07-02 20:42:44 2066

原创 GPT-4o文科成绩超一本线,理科为何表现不佳?

什么?许多大模型的文科成绩竟然超过了一本线,还是在竞争激烈的河南省?没错,最近有一项大模型“高考大摸底”评测引起了广泛关注。河南高考文科今年的一本线是521分,根据这项评测,共有四个大模型的分数大于或等于这个分数,其中最值得关注的是前两名:GPT-4o:562分字节豆包:542.5分……

2024-07-01 23:03:37 1231 1

原创 菲尔兹奖得主测试GPT-4o,经典过河难题未能破解!最强Claude 3.5回答离谱!

最近,菲尔兹奖得主Timothy Gowers分享了他测试GPT-4o的经历,结果模型在最简单的题目上竟然出错了,甚至网友们发现,Claude 3.5也未能幸免。GPT-4o深夜发布!Plus免费可用!在经典的「狼-山羊-卷心菜」过河问题上,如今所有的大语言模型都失败了!几天前,菲尔兹奖得主、剑桥大学研究主任Timothy Gowers直接测试了GPT-4o,试图解决这个动物过河难题。他提出了一个新的评估标准—,即模型给出的总答案与正确答案之间的比率。

2024-06-30 22:22:52 1095

原创 GPT-4替代大学生参加考试,94%成功作弊未被发现!

为了保证AI的「真实性」,GPT-4生成的内容被100%原汁原味地搬运到试卷上,作者没有添加过渡文字或用任何方式修改文本内容,最大的改动就是为论文添加必要格式,或者删去模型径自生成的免责声明和参考文献。在这项研究中,只要评分员将作业标记为「值得关注」,可能存在某种形式的不良学术行为或学术不端,都不需要特别提到AI,就算是被检测到了。在83.4%的情况下,AI的成绩高于随机选择的学生。但最近英国的研究人员在现实的大学考试中为AI做的这次「图灵测试」,已经将实验过程和数据以论文的形式发布了出来。

2024-06-29 19:55:17 1145

原创 OpenAI发布新模型CriticGPT:利用GPT优化GPT训练,RLHF实现超越人类能力!

近日,OpenAI突然发布了一个新模型!这个模型基于GPT-4训练,旨在帮助下一代GPT的训练。此外,它还能为这些错误撰写“评论”,在60%的情况下,人类训练师更喜欢有CriticGPT帮助下的批评。但这项研究的关键在于,例如,。更好的RLHF训练能产生更强的模型,而更强的模型又能通过更好地挑错来增强RLHF训练……这篇论文来自已解散的超级对齐团队,由前负责人Jan Leike带队完成。Leike本人已经跳槽到Anthropic,继续从事类似研究。

2024-06-28 14:18:56 1988

原创 GPT-4o首次引入!全新图像自动评估基准发布!

引入支持多模态的GPT-4o,实现与人类偏好的深度对齐和自动化评估。推出了一个更为全面和多元化的数据集。

2024-06-27 20:16:38 987

原创 AI奥林匹克竞赛:Claude-3.5-Sonnet对决GPT-4o,谁是最聪明的AI?

回答这个问题的挑战在于我们首先需要一个足够挑战的智力测试基准,使得我们可以区分目前最高水平的AI。上海交通大学生成式人工智能实验室(GAIR Lab)推出的OlympicArena(奥林匹克竞技场)满足了这个需求。奥林匹克学科竞赛不仅是对人类(碳基智能)思维敏捷性、知识掌握和逻辑推理的极限挑战,更是AI(“硅基智能”)锻炼的绝佳练兵场,是衡量AI与“超级智能”距离的重要标尺。OlympicArena是一个真正意义上的AI奥运竞技场。

2024-06-25 17:52:48 1231

原创 ChatGPT之母:AI自动化将取代人类,创意性工作或将消失

AI工具可以降低门槛,允许任何有想法的人进行创作。通过精心设计这些与人类创造者合作的技术,我认为我们可以创造出绝妙的工具,帮助艺术家拥有更多控制权,更具创新性,并探索新的可能性前沿。随着AI工具承担更多重复性或机械性的创作过程,如生成SEO元数据,我们可以解放人类创作者,让他们专注于更高水平的创造性思维和选择。Klarna的首席执行官在接受《华尔街日报》采访时表示,这极大地提高了公司的效率,意味着用更少的人完成更多的工作。但重要的是,要认识到临时创意任务,和为社会带来持久意义和价值的创意任务,之间的区别。

2024-06-24 21:06:47 1053

原创 DeepSeek-Coder-v2击败GPT-4 Turbo,成为竞技场最强开源编码模型!

就在刚刚,竞技场排名再次刷新:没体验过OpenAI最新版GPT-4o?快戳最详细升级教程,几分钟搞定:升级ChatGPT-4o Turbo步骤在编码领域的整体性能评估中,DeepSeek-Coder-v2的评分和稳定性均位于前10,超越了智谱GLM-4、Llama-3等一众知名开源模型。据了解,完全开源的DeepSeek-Coder-v2现提供236B和16B两种参数规模,支持338种编程语言和128K上下文长度。

2024-06-24 20:56:20 1035

原创 CVPR‘24 最佳学生论文,从灵感到成稿仅用一个月,源自业余创意!

更可能的是,在研究过程中会出现一些有趣的相关问题,这些问题值得研究,你不应该因为它们与你最初的研究计划不完全一致而忽视它们。事实上,他当时正在研究另一个使用更「传统」神经隐式表示的项目,但那个项目进展不顺利,遇到了很多障碍。不过,他也指出,在现行科研系统中,科学家需要通过提交研究计划和撰写资助申请书来获取资金,这与好奇心驱动的研究理念不符,尤其是在AI这样快速发展的领域。Geiger还提到,Zehao Yu之前参与过多个项目并发表过论文,但在Mip-Splatting项目之前,他从未接触过高斯泼溅技术。

2024-06-22 21:23:56 747

原创 超越GPT-4o!新王Claude 3.5 Sonnet来啦!免费使用

此外,作为对安全和透明度承诺的一部分,Anthropic还与外部专家合作测试和完善这一最新模型中的安全机制。如何使用WildCard正确方式打开GPT-4o,

2024-06-21 14:46:11 2082

原创 GPT-4o打破ARC-AGI不可挑战的神话!71%准确率创下新SOTA!!

ARC-AGI的数据集由视觉问题组成,输入输出示例是由彩色单元格组成的网格,任务是猜测从输入到输出的转换规律,然后补全缺失的网格。看起来很简单,就像小学的奥数题,但公共测试集中的任务要难得多,对于人类来说也有些棘手,但并非不可解决。每一项ARC-AGI任务都是经过人工验证的,包括公共测试集,确保ARC-AGI的所有任务都可以由人类解决。毕竟这是一个通用人工智能基准,如果连人类都难倒了,那拿去测试LLM也说不过去。

2024-06-20 23:29:58 987

原创 进化版ChatGPT的Siri今年无缘上线!苹果正打造史上最薄iPhone 17

最新报道称,苹果的AI功能将在未来几个月逐步推出,并持续到2025年。据称,今年夏天结束前,开发者们仍无法试用和体验。此外,Mark Gurman提到,上半年发布的最轻薄iPad成为了苹果硬件产品的新开端。没体验过OpenAI最新版GPT-4o?快戳最详细升级教程,几分钟搞定:升级ChatGPT-4o Turbo步骤更令人期待的是,苹果正致力于打造更轻薄的iPhone 17,并计划让未来的MacBook Pro和iWatch也走同样的路线。

2024-06-19 22:07:29 670

原创 AI教育的“智”变大考,小度率先提交答卷!!

众所周知,教育行业面临的一大难题,是“千人一面”的教和“千人千面”的学的矛盾。但由于资源和成本等多种因素限制,一对多的教学是常态,很难真正实现因材施教。传统的学习机产品普遍按照学科维度,尽可能多地汇集各类学习内容、资源及工具。随着AI技术的加入,很多高端学习机产品已经落地了诸如精准学、作文指导、口语练习、互动阅读等各种AI功能,从刷题、改作业到素质教育,一应俱全。但孩子不愿意学,或者学不进去怎么办?这个问题却鲜少有人思考。

2024-06-19 21:39:08 1021

原创 上海AI Lab推出8B模型,奥数成绩媲美GPT-4

只用1/200的参数,就能让大模型拥有和GPT-4一样的数学能力?复旦大学和上海AI实验室的研究团队刚刚研发出了一款具有超强数学能力的模型。这款模型名为。没体验过OpenAI最新版GPT-4o?快戳最详细升级教程,几分钟搞定:升级ChatGPT-4o Turbo步骤MCTSr结合了AlphaGo中使用的蒙特卡洛算法与Llama 3,能够用少量数据实现与GPT-4等大模型相同的效果,让网友感叹Q*成真,那么,MCTSr具体运用了什么方法呢?

2024-06-18 20:11:42 1603 1

原创 全球首个开源类Sora模型大升级,16秒720p画质电影感爆棚!代码和权重全面开源!

潞晨Open-Sora团队刚刚在720p高清文生视频质量和生成时长上实现了突破性进展!全新升级的Open-Sora不仅支持无缝生成任意风格的高质量短片,没体验过OpenAI最新版GPT-4o?快戳最详细升级教程,几分钟搞定:升级ChatGPT-4o Turbo步骤通过他们的模型权重,可以生成各种酷炫短片,如海浪与海螺的亲密接触,以及深不可测的森林秘境。人物肖像的渲染也相当逼真,。即使是电影级别的镜头制作,也能轻松应对。

2024-06-18 19:47:55 1084

原创 AI写代码,CS还有前途吗?加州大学伯克利分校:CDSS申请人数激增48%!

AI写了这么多代码,你还应该学习计算机科学吗?没体验过OpenAI最新版GPT-4o?快戳最详细升级教程,几分钟搞定:升级ChatGPT-4o Turbo步骤UCB教授分析,AI还没有学会创新,人类软件开发者可以利用AI提质增效。围绕生成式人工智能的一个主要担忧是,这项技术是否会让人们失业。在「即将被人工智能取代的十大职业」等榜单中,软件工程师经常上榜。

2024-06-17 19:21:24 1003

原创 GPT-4并非世界模型,LeCun双手赞同!ACL力证LLM无法模拟真实世界

一直以来,支持LLM的观点之一是模型可以集成海量事实知识,作为通往「世界模拟器」的基础。虽然也有不少反对意见,但缺乏实证依据。最近,亚利桑那大学、微软、霍普金斯大学等机构联合发布了一篇论文,从实证角度否定了这一观点。最新研究已被ACL 2024顶会接收。研究发现,GPT-4在模拟基于常识任务的状态变化时,比如烧开水,升级ChatGPT-4o Turbo步骤论文认为,尽管GPT-4表现惊艳,但如果没有进一步创新,它不能成为可靠的世界模型。

2024-06-16 21:59:48 841

原创 英伟达开源3400亿参数巨兽,98%合成数据训练出最强开源通用模型!性能媲美GPT-4o

英伟达刚刚再次证明了其在AI创新领域的领导地位。它全新发布的Nemotron-4 340B,是一系列具有开创意义的开源模型,有望彻底改变训练LLM的合成数据生成方式!这一突破性进展标志着AI行业的一个重要里程碑——各行各业无需依赖昂贵的真实世界数据集,用合成数据即可创建性能强大的特定领域大语言模型!升级ChatGPT-4o Turbo步骤。

2024-06-15 19:41:01 1050

原创 OpenAI半年收入达34亿美元:年化收入翻倍,CTO却揭露:ChatGPT与免费模型差距不大

周一,OpenAI任命美国最大的邻里社交APP Nextdoor的前首席执行官Sarah Friar为首席财务官,还任命了Twitter和Instagram的前产品开发负责人Kevin Weil为新的首席产品官。然而,在她的一段发言中,透露了一个令人担忧的讯息,她声称「OpenAI实验室的人工智能模型并不比公开的模型先进多少」,这似乎不利于建立投资者信心。例如,去年秋季,竞争对手Anthropic告诉投资者,其年收入达到1亿美元,计划在2024年年底前实现超过8.5亿美元的年收入。GPT-4o深夜发布!

2024-06-14 13:17:45 1041

原创 手机流畅运行470亿参数大模型,上交大发布PowerInfer-2推理框架,性能提升29倍

这种基于神经元簇的流水线打破了传统推理引擎中逐矩阵计算的方式,允许来自不同参数矩阵的神经元簇交错执行,达到最高的并行效率。针对手机运行内存不足的问题,PowerInfer-2.0利用了稀疏模型推理的特点:每次只需激活一小部分神经元,即。频繁激活的“热神经元”被放置在运行内存中,而“冷神经元”只有在被预测激活时才会被拉进内存,大幅降低了内存使用量。,在一个神经元簇等待I/O时,可以及时调度另一个已准备好的神经元簇到处理器上计算,从而隐藏I/O延迟。),并且消耗大量内存,这在很大程度上限制了其应用场景。

2024-06-13 12:59:31 1074

原创 GPT-4o更易越狱?北航&南洋理工上万次测试详解!

因此在本研究中,作者使用它来评估文本模态的安全性。PAP是另一种专门为越狱大语言模型设计的方法,它在基于文本越狱攻击方法中拥有最高的ASR(GPT-4V和GPT-4o的ASR分别为62.2%和62.7%)。BAP是作者最近提出的一种多模态越狱攻击方法,但在报告中,主要利用的是它的文本优化方法,结果BAP在攻击GPT-4V时达到了最高的ASR,达到83.1%。为了评估GPT-4o的安全风险及其相较于上一代模型的变化,作者将目标模型设置为GPT-4V和GPT-4o,利用API和移动应用对这些模型进行评估。

2024-06-12 21:23:22 1279

原创 13名LLM考生挑战高考数学卷,GPT-4o仅排第3名!!!

而在新Ⅱ卷的评测中,讯飞星火、阿里千问、GPT-4o的准确率均超过60%,在这次评测中,阿里千问和讯飞星火分别获得了2024高考数学新Ⅰ卷的第一名和第二名,以及高考数学新Ⅱ卷的第二名和第一名。今年,复旦大学的研究团队独辟蹊径,将目光聚焦在全新出炉的2024高考数学试卷上,并开创性地提出用高考题来评测大模型!在新Ⅰ卷中,阿里千问和讯飞星火对14道数学客观题的准确率达到70%以上,大幅领先GPT-4o的57%。最关键的是,数学能力一直是GPT-4o引以为傲的模块。GPT-4o深夜发布!

2024-06-12 21:04:39 484

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除