科技资讯
文章平均质量分 88
南 阳
这个作者很懒,什么都没留下…
展开
-
ChatGPT网页版新增聊天记录搜索功能,终于不再翻找!
此外,光头哥还发布了一些最新预告,表示SearchGPT的集成与高级语音模式都在路上,界面UI也会发生一些变化,甚至有可能把聊天记录存储在本地。点击后,会弹出一个搜索框,用户只需输入想要搜索的关键词,系统便会在历史对话的标题和正文中进行匹配,展示含有搜索词的结果。相比之下,ChatGPT不仅把聊天记录搜索功能放在了更加显眼的侧边位置,还支持深入到聊天正文,这无疑提升了用户的便利性。然而,Claude的搜索功能需要用户先进入专门的聊天记录管理页面,并且在此之前并没有关于搜索的指引。原创 2024-10-31 18:25:38 · 381 阅读 · 0 评论 -
国产大模型新突破:Yi-Lightning发布,超越GPT-4o冲击全球榜单
总成绩几乎与马斯克最新的xAI大模型Grok-2-08-13持平,超越了GPT-4o-2024-05-13、GPT-4o-mini-2024-07-18、Claude 3.5 Sonnet等顶级模型。最后,谈到与国外顶尖大模型的差距时,李开复博士表示,Yi-Lightning的排名证明了国产大模型与硅谷最顶尖模型的差距缩小到了五个月。在中文能力方面,Yi-Lightning和GLM-4-Plus这两个国产大模型都名列前茅,Yi-Lightning并列第二,与o1-mini相差无几。其优势在于其极速的性能。原创 2024-10-17 12:10:45 · 683 阅读 · 0 评论 -
哈佛混不下去的学者,32年后拿下诺奖:发现miRNA
2024年诺贝尔生理学或医学奖已揭晓,美国科学家维克托·安布罗斯(Victor Ambros)和加里·鲁夫昆(Gary Ruvkun)共同荣膺此殊荣。他们的主要贡献在于发现了microRNA的存在,并揭示了它在基因调控中的核心作用。microRNA在多种严重疾病(如癌症、糖尿病、自身免疫疾病等)中的调控机制被深入研究后,科学家们有望找到更多新的治疗靶点,并开发出更先进的诊断工具和疗法。诺贝尔奖委员会指出,这一发现揭开了基因调控领域的新篇章,microRNA对于包括人类在内的生物至关重要。原创 2024-10-15 20:22:14 · 1072 阅读 · 0 评论 -
AI与物理学的交汇:Hinton与Hopfield获诺贝尔物理学奖
今年的诺贝尔物理学奖颁给了机器学习领域的两位先驱,杰弗里·辛顿(Geoffrey Hinton)和约翰·霍普菲尔德(John Hopfield)。这打破了此前人们关于该奖项可能颁发给凝聚态物理或量子物理领域科学家的预测。机器学习,尤其是神经网络技术,成为今年的获奖领域,标志着人工智能技术在科学界获得了前所未有的认可。这一奖项表彰的是他们为人工神经网络的研究与发展所做出的基础性贡献,这些工作不仅在计算机科学领域产生了深远影响,更从根本上改变了我们理解和模拟人类大脑工作的方式。原创 2024-10-11 17:23:18 · 1004 阅读 · 0 评论 -
清华系“仓颉”来袭:图形起源:用AI颠覆字体设计,推动大模型商业化落地
在一个鲜为人知的字体设计赛道上,清华创业公司“图形起源”悄然实现了商业变现:他们帮助字体公司将成本降低了80%,生产速度提升了10倍以上。Canva可画平台上最受欢迎的前100套中文字体,大部分都是通过他们的算法生成的。这个市场虽然规模较小,但需求却十分迫切。设计公司和字体公司长期以来深受版权费用的困扰。而图形起源凭借其在图形学和AI方面的技术优势,提供了人工无法匹敌的效率与精度。接下来,让我们来看看他们是如何通过AI造字,发现并实现商业化的。原创 2024-10-08 17:33:51 · 582 阅读 · 0 评论 -
Flux1.1:掀起AI文生图风暴,一键生成照片级真实图像
在人工智能领域,文本生成图像(Text-to-Image)技术日益成熟,最近发布的Flux1.1模型更是引发了广泛关注,迅速在各大社交媒体平台上刷屏。这个模型以其强大的图像生成能力和一个简单易用的技巧,让生成的图像几乎无法与真实照片区分开来。通过模仿单反相机的文件命名格式,用户能够生成看似由真实相机拍摄的高质量图像,无论是人物肖像还是自然风景,都能达到照片级的真实感。评论区的网友们纷纷表达了对这一技巧的惊叹,不少人表示:“我完全分不清这到底是AI生成的还是实际拍摄的!原创 2024-10-07 15:49:31 · 907 阅读 · 0 评论 -
Meta抢先发布Movie Gen:AI视频生成迈向全新高度,超越Sora引领视频编辑革命
有人认为,Meta的这次发布可能迫使OpenAI尽快推出Sora进行应对,而在10月1日,Pika 1.5的更新也进一步引领了AI视频编辑功能的创新,如在视频中加入物体的融化、膨胀、挤压等物理特效。总的来说,Meta Movie Gen的推出标志着AI视频生成技术的重大突破,从视频的生成、编辑、音效同步到个性化视频的生成,Meta在多个维度上取得了显著的进展。用户只需输入一句简单的指令,例如“把灯笼变成飞向空中的泡泡”,系统就可以自动替换视频中的物体,而且生成的泡泡还能准确反射背景环境的细节。原创 2024-10-05 12:54:07 · 601 阅读 · 0 评论 -
中国电信解锁万亿参数大模型:TeleAI的创新与突破
为了提升训练性能,TeleAI采用了多维混合并行的技术,可以通过设置不同的并行模式,实现数据并行、模型并行和流水线并行的自动混合使用,支持万亿模型在万卡集群上的高效分布式训练。根据了解,训练过程中使用的万卡集群由天翼云上海临港国产万卡算力池提供,基于天翼云自研的“息壤一体化智算服务平台”和电信人工智能公司自研的“星海AI平台”的支持,可以实现万亿参数的稳定训练,平均每周仅有1.5次训练中断,集群训练的稳定性达到了国际领先水平。GQA能大幅降低模型推理过程中的显存使用量,显著提升模型的外推长度和推理性能。原创 2024-10-01 21:52:34 · 1107 阅读 · 0 评论 -
智能新宠:BabyAlpha A2开启家庭机器人新时代
具身智能领域的“疯狂”,已经迈入了全新的阶段!让我们一起来看看这段视频:一个人形机器人在前面奔跑,一群机器狗紧随其后;接着是人追赶机器狗,随后机器狗又追逐人……视频最后,那个机器人似乎还带着一丝“调皮”的意味。别误会,这不是《恐怖游轮》或《开端》中的诡异循环,而是一家国内具身智能企业的最新产品展示。。这一整套全面的产品布局,让人眼前一亮。尽管目前尚无人能够准确预测具身智能的最终形态,但这家国产具身智能公司通过其新产品表达了他们的观点:未来的具身智能世界,很可能是“多物种”共生的。原创 2024-09-27 15:36:39 · 1053 阅读 · 0 评论 -
GPT-4o高级语音全量上线:自定义指令、记忆功能引爆新体验
谷歌刚宣布推出Gemini-1.5-Pro-002和Gemini-1.5-Flash-002,OpenAI紧接着就把流量吸引了过去。OpenAI表示,将在一周内向所有ChatGPT Plus和Team用户开放,唯独欧盟、英国、瑞士、冰岛、挪威和列支敦士登暂不提供。在日常使用中,你可以让它在一旁静静待机,随时提问即可开始对话。它会记住你设定的住址,并主动推荐附近的游玩地点,甚至连路线都帮你想好了——沿着1号公路探索海岸线。“奶奶,对不起,我迟到了,我不是故意让您等这么久的,我可以怎么补偿您呢。原创 2024-09-25 19:28:40 · 320 阅读 · 0 评论 -
大模型推理革新:探索思维图(DoT)框架的逻辑与应用
而DoT则直接在单一模型内构建有向无环图,避免了外部控制机制或多个模型的依赖,训练和部署更为简便。值得注意的是,当前大模型中的“顶流”OpenAI o1已具备生成CoT的能力,而更强大的DoT的到来,是否意味着可以通过强化学习内化到模型中?在该框架中,命题被建模为拓扑中终端对象的子对象,逻辑关系和推理步骤用态射表示,批评与改进过程则分别对应子对象分类器的态射和命题间的态射。此外,在DoT中,模型生成的批评反馈为自然语言形式,而非CR中仅提供的二元信号,使模型能够接收到关于错误的详细解释,更有效地改进命题。原创 2024-09-24 16:10:35 · 827 阅读 · 0 评论 -
AI挑战《黑神话·悟空》:阿里大模型超越人类玩家
动作规划系统通过情境库、动作库和人类引导库进行推理,结合视觉输入生成智能决策,而人类引导轨迹系统则通过人类操作数据帮助优化智能体的表现,特别是在面对困难任务时,通过查询历史操作生成更加精确的动作。实验数据显示,在对抗普通小怪时,AI的表现已与人类玩家不相上下。《黑神话·悟空》中的精英怪——牯护院,已经被AI智能体轻松击败,AI不仅能灵活躲闪和精确攻击,甚至在对抗鸦香客和牯护院时,其胜率已超越了人类玩家。令人期待的是,这项研究不仅展示了AI在游戏场景中的应用潜力,也为大模型的多领域扩展提供了全新的思路。原创 2024-09-23 11:04:10 · 778 阅读 · 0 评论 -
AI客服对决:智能客服PK赛揭示企业级AI应用未来
然而,就是在这样的情境下,AI客服系统展现了出色的表现,赢得了围观者的阵阵喝彩。选手们在百炼平台上开发客服系统,可以使用通义千问系列模型作为底层支持,依靠平台提供的Prompt优化工具、RAG(检索增强生成)以及Agent构建能力,灵活应对低代码和高代码的开发需求。正因为如此,开发智能客服的门槛仍然较高,但随着百炼等开发平台的升级完善,这一问题正在逐步得到解决。最近,一场别开生面的AI客服挑战赛引发了热议:一位使用“花开富贵”阿姨人设的Agent甩出一条链接,结果对面的AI客服立刻开始了大段的自动回复。原创 2024-09-22 10:08:07 · 628 阅读 · 0 评论 -
3D生成技术再创新高:VAST发布Tripo 2.0,提升AI 3D生成新高度
随着《黑神话·悟空》的爆火,3D游戏背后的AI 3D生成技术也逐渐受到更多的关注。虽然3D大模型的热度相较于语言模型和视频生成技术稍逊一筹,但全球的3D大模型玩家们却从未放慢脚步。无论是a16z支持的Yellow,还是李飞飞创立的World Labs,3D大模型的迭代速度一直在稳步前进。近日,国内3D大模型的领军者VAST发布了最新版本的大模型——Tripo 2.0。这个基于千万级高质量原生数据库训练的超强模型支持文字、单图、多图输入,并在几何精细度和图像还原度上表现出色。原创 2024-09-21 12:13:38 · 1605 阅读 · 1 评论 -
阿里开源多模态大模型Ovis1.6,重塑出海电商AI格局
训练策略方面,通过DPO等优化手段,进一步增强了模型的生成和理解复杂任务的能力。这一次,阿里国际AI团队开源的多模态大模型Ovis1.6,不仅成功开源,还在多模态评测基准OpenCompass上击败了Qwen2VL-7B、InternVL2-26B和MiniCPM-V-2.6等主流开源模型,荣登300亿参数以下模型榜首。特别是在退货和退款审核环节,Ovis1.6通过处理用户提供的图文、视频信息,实现了秒级别的审核,极大减少了人力成本,提高了效率和一致性,确保了商家与消费者的公平权益。原创 2024-09-20 11:33:02 · 1019 阅读 · 0 评论 -
OpenAI 的最强模型 o1 的“护城河”失守?谷歌 DeepMind 早已揭示相同原理
发布不到一周,OpenAI 的最新模型 o1 的“护城河”似乎已经失守。近日,有人发现谷歌 DeepMind 早在今年 8 月发表的一篇论文,揭示了与 o1 模型极其相似的工作原理。这项研究指出,在模型推理过程中增加测试时的计算量,比简单地扩展模型参数更有效。基于论文中提出的计算最优(compute-optimal)测试时计算扩展策略,规模较小的基础模型在某些任务上甚至可以超越一个规模大14倍的模型。有网友惊呼:这几乎就是 OpenAI o1 的原理!原创 2024-09-19 12:20:52 · 1213 阅读 · 0 评论 -
OpenAI的o1模型与Transformer的无限潜力:数学证明推理算力无上限
对于任何可以用多项式大小的布尔电路计算的函数,都存在一个仅有常数层数的Transformer,可以通过足够长的思维链(CoT)来模拟电路的计算过程,从而计算出这个函数。证明的思路是先将布尔电路视为一系列逻辑门的组合,然后利用Transformer中的位置编码为每个逻辑门及其状态分配一个独特的表示,通过逐步计算来模拟整个电路的执行过程。在此基础上,作者进一步证明,具有O(T(n))长度CoT的常数深度Transformer,可以模拟任意T(n)大小的电路,因此其计算能力等价于多项式大小的电路。原创 2024-09-17 17:23:50 · 1175 阅读 · 0 评论 -
超越OpenAI:格灵深瞳引领多模态大模型的创新与实践
它的多模态大模型不仅在多个权威数据集上的表现超过了OpenAI,更是用一个个落地案例向大家展示,大模型并不仅仅包括大语言模型,视觉大模型和多模态大模型在产业界有更大的想象空间。格灵深瞳自研视觉大模型Unicom系列就是这一转变的成果,通过做大数据的规模、做大计算的规模来做强通用能力,让模型以统一的方式对世界进行“理解”和“泛化”。而通用视觉大模型具备少样本学习、跨场景泛化的能力,再结合上语言模型的多模态生成范式,现在AI只要智能识别到缺陷,同时就能给出文字描述,供现场工作人员参考。原创 2024-09-16 10:09:11 · 1415 阅读 · 0 评论 -
GameGen-O:大模型颠覆3A游戏开发
为了使VAE更适应游戏领域,团队对VAE解码器进行了特定领域的调整,并采用了不同帧速率和分辨率的混合训练策略,以增强跨帧率和分辨率的泛化能力。模型整体架构遵循了Latte和OpenSora V1.2框架的原则,通过掩码注意力机制,GameGen-O具备了文本到视频生成和视频续集的双重能力。接着,这些视频片段被切割成更小的片段,并根据美学、光流和语义内容进行严格排序和过滤。这种训练方法,结合OGameData数据集,使模型能够稳定且高质量地生成开放领域的视频游戏内容,为后续的交互控制奠定了基础。原创 2024-09-15 12:04:35 · 738 阅读 · 0 评论 -
电信网络携手大模型:AI赋能网络运维的新范式
边缘服务器的应用保障了数据的即时交互与响应速度,使首字符延时不到1秒,生成延时约50毫秒,满足了大模型推理的需求。至今,网络大模型已覆盖网络“规、建、维、优、营”全生命周期,围绕知识问答、辅助助手、智能体三个维度,打造了12个AI助手。这正是CPU的“主场”。这次实践表明,选择CPU进行网络大模型推理部署,经过大型企业验证,不仅满足时延、吞吐、功耗等业务需求,推理成本也大幅下降。据悉,该网络大模型在日常应用中,问答准确率达到85%,方案生成可用率90%,故障处置效率提升30%,高危指令稽核效率提升50%。原创 2024-09-14 11:28:53 · 825 阅读 · 0 评论 -
OpenAI发布全新o1系列:AI推理能力的革命性突破
换句话说,思维链越长,o1的思考越深入,推理表现越出色。在2024年国际信息学奥林匹克竞赛(IOI)的测试中,o1的微调版本在50次尝试条件下取得了213分,跻身人类选手的前49%。相比之前的GPT-4o,o1在解决高难度问题时表现显著提升。例如,在博士级别的物理问题测试中,GPT-4o仅取得了59.5分,而o1模型一举获得92.8分,达到了“优秀”水平。目前o1的推理时间为几秒至十几秒,但OpenAI的目标是让未来版本花费数小时、数天甚至数周来思考,尽管推理成本会增加,但这种深入思考有望带来突破性发现。原创 2024-09-13 12:39:12 · 962 阅读 · 0 评论 -
AI战升级:千亿大模型如何重塑网络安全未来?
AI以黑客的身份学习了自动化攻击技术,并且成功率相当高。根据伊利诺伊大学香槟分校研究团队的最新研究,既然攻击者已经与时俱进,利用AI新技术进行破坏,防御方自然不会坐以待毙,正在积极将AI大模型纳入反制策略,最近发生了一件大事:刚刚完成10亿融资的新生代网络安全领军企业长亭科技,与同为清华系的AI基础设施厂商趋境科技联手,发布了新一代安全大模型解决方案。此次合作将至此,网络安全行业正式迈入千亿大模型时代。原创 2024-09-12 17:31:45 · 1272 阅读 · 0 评论 -
“再造云端:姚欣的分布式革命,如何引领AI时代的基础设施变革”
这个月,PPTV创始人再次站到了聚光灯下,组织了一场分布式云计算论坛,向外界揭开了他的新篇章。姚欣的第二次创业,瞄准了,要打造 AI 时代的基础设施。但姿势独特:公司。成立六年来,PPIO派欧云已获三轮共4亿元的融资,包括百川智能创始人、迅雷创始人、前微软Azure中国总裁在内的19位CEO都参与了天使投资。姚欣,曾是互联网视频时代的开拓者,2004年,他在华中科技大学读研时辍学创业,。PPTV在PC时代创立,移动互联网早期就迅速崛起,2012年位列中国视频网站用户规模第2名。原创 2024-09-11 15:19:07 · 1368 阅读 · 0 评论
分享