自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1093)
  • 资源 (1)
  • 收藏
  • 关注

转载 关于post-training和一些思考

作者丨yanwushen来源丨https://zhuanlan.zhihu.com/p/710936230编辑丨极市平台最近有趋势是要扩大post-training规模,本文讨论的就是Llama3.1等开源大模型的技术报告里的post-training部分,已经有很多文章提到其中的细节要点了,这里更着重于比较大的层面。DPO vs PPO整个93页报告当然是很有份量的,很大程度的推进了领域内的...

2024-09-23 11:05:38 46

转载 大模型是一场泡沫?

作者:wzporzhttps://www.zhihu.com/question/663581801/answer转眼,2024年的九月就要带来,能写在简历里的东西,和两年前没什么区别。为数不多的变化是精神状态,从对未来充满希望,变得无所适从,变得绝望,变得死亡,又开始在死亡里寻找一点点新的生活的影子。与我个人不同,大模型的格局却变化了太多。资本市场对应用层的狂热已经熄火很久了,没有人再对AI应用有...

2024-09-20 11:05:58 73

转载 聊一聊大模型六小虎生存现状

ChatGPT横空出世,打响了生成式AI创业热潮的发令枪。在国内,智谱AI、百川智能、零一万物、月之暗面、Minimax率先领跑。今年6月,前微软全球副总裁姜大昕创办的阶跃星辰,开始受到资本的青睐,一轮20亿美元的融资,将其送上了第一梯队的牌桌。自此,大模型创企的“六小虎”的格局形成。从新年伊始,AI应用层的井喷被预告为今年AI领域的最强看点。3月份,Kimi200万字长文本横空出世,率先出圈。此...

2024-09-12 11:05:22 215

转载 无需等待:电商重排模型在线学习

在当前典型工业应用推荐系统 pipeline 中,重排作为最后一个环节,决定最终的推荐结果,因此需要综合考虑多样的业务需求以及复杂物料的融合。经典的在线学习依赖用户反馈,在电商场景,用户完成一次购买决策通常需要几小时甚至几天,这无法避免地限制着在线学习的实时性。本文将介绍一种新型的用于重排的在线学习方法,该方法不强依赖用户反馈,能够确保模型的实时性。该方法由阿里巴巴与中国人民大学共同提出。今天的介...

2024-09-09 11:05:21 160

转载 大模型SFT的局限性

作者|ybqhttps://zhuanlan.zhihu.com/p/717275921今天看到了一个问题“为什么要做 rlhf,sft 不够吗?” 很多大佬都分享了自己做 rlhf 的一些经验和心得。收获蛮多的同时,我留意到,大佬们都在说 rlhf 有多重要,怎么优化 rlhf,rlhf 能带来多大的提升,却并没有直面这个问题:为什么非做 rlhf 不可呢?或者说,用 reward_mod...

2024-09-05 11:05:42 95

转载 校招生做大模型,选预训练还是SFT?

作者:ybq链接:https://www.zhihu.com/question/635761315/answer/3608088928我推荐选 pretrain,理由如下:pretrain 提高工程能力,sft 提高认知能力作为校招新人,你的当务之急只有一条:提升工程代码能力!我们拆解一下两个团队所需要的技能,你判断下哪个提升代码能力更快。在 pretrain 团队,你的必修课有:爬取互联网数据,...

2024-09-03 11:05:14 113

转载 大语言模型:数学推理优化

导读本文将分享如何提升大模型的数学推理能力。我们没有把数学推理能力与翻译、长文本生成等专项分开优化,而是视为通用能力的一部分。因为我们认为数学推理能力是衡量大模型智能水平的关键指标。主要内容包括以下五个部分:1.大语言模型概述2.混合指令3.合成数据4.训练优化5.问答环节分享嘉宾|文亮 奇虎360 资深算法专家出品社区|DataFun01大语言模型概述首先来回顾一下大模型的基本结...

2024-09-02 11:05:52 316

转载 不花一分钱!GPT-4o微调限时免费开放,每日附赠百万训练token

一觉醒来,OpenAI又上新功能了:GPT-4o正式上线微调功能。并且官方还附赠一波福利:每个组织每天都能免费获得100万个训练token,用到9月23日。也就是说,开发人员现在可以使用自定义数据集微调GPT-4o,从而低成本构建自己的应用程序。要知道,OpenAI在公告中透露了:GPT-4o微调训练成本为每100万token 25 美元(意味着每天都能节省25美元)收到邮件的开发者们激动地奔走相...

2024-08-22 11:05:39 78

转载 从ACL 2024录用论文看混合专家模型(MoE)最新研究进展

作者| 杨远航整理|PaperWeeklyACL 2024 论文放榜,扫了下,SMoE(稀疏混合专家)的论文不算多,这里就仔细梳理一下,包括动机、方法、有趣的发现,方便大家不看论文也能了解的七七八八,剩下只需要感兴趣再看就好。下面是列表,顺序大抵是个人兴趣程度排序。1. DeepSeekMoE: Towards Ultimate Expert Specialization in Mixtu...

2024-08-19 11:05:37 74

转载 互联网大厂月薪分布。。。

下面表格列出了国内互联网大厂月薪分布,包括字节、知乎、携程、小米、小红书、网易、腾讯、拼多多、陌陌、美团、快手、京东、华为、国美、滴滴、贝壳、阿里、B站、58同城和360。共有 8 个月薪区间,分别是:6-8K8-10K10-15K15-20K20-30K30-50K50K+高薪区间(50K+)的分布:大部分公司的高薪区间(月薪超过 50,000元)的员工比例相对较低,字节和 PDD 这个区间的比...

2024-08-18 11:05:59 111

转载 小红书推荐系统全解析:去中心化内容分发

小红书作为在国内因种草而声名大噪的社区,伴随用户规模的扩大,已逐渐发展成为多元化的线上社区。众多用户通过笔记来记录和分享自己的生活方式,当前每日可分发的内容多达数十亿,每日新增发布的内容有数百万之多,涵盖图文与视频等形式,这些我们称之为笔记。目前小红书每日可产生数百亿次的曝光量,每日超过一半的用户在小红书内产生互动行为,每日搜索查询量达到亿级。就产品形态而言,小红书现分为双列信息流和视频沉浸流两种...

2024-08-15 11:06:03 164

转载 八问八答搞懂Transformer内部运作原理

七年前,论文《Attention is all you need》提出了 transformer 架构,颠覆了整个深度学习领域。如今,各家大模型都以 transformer 架构为基础,但 transformer 内部运作原理,仍是一个未解之谜。去年,transformer 论文作者之一 Llion Jones 宣布创立人工智能公司 Sakana AI。近期,Sakana AI 发表了一篇题为《T...

2024-08-09 11:05:28 85

转载 SFT、RLHF、DPO、IFT —— LLM 微调的进化之路

作者:边路腰刀原文:https://zhuanlan.zhihu.com/p/710652762TL;DR• SFT、RLHF 和 DPO 都是先估计 LLMs 本身的偏好,再与人类的偏好进行对齐;• SFT 只通过 LLMs 生成的下一个单词进行估计,而 RLHF 和 DPO 通过 LLMs 生成的完整句子进行估计,显然后者的估计会更准确;•虽然 RLHF 和 DPO 取得比 SFT 好的结果...

2024-08-07 11:05:31 109

转载 从大数据到大模型:搜索推荐技术的前沿探索

导读大家好,我是施兴(花名叔宝),来自阿里云机器学习平台 PAI,主要负责产品架构。我们团队主要负责:①搜索推荐,这是我们较为成熟的一个领域;②涉及图像和视频多模态处理,如图像视频打标和 Stable Diffusion 文生图,文生视频等相关工作;③在大模型场景下,阿里有通义系列大模型,我们负责通义的底层平台及相关训练推理优化工作;④进行 RAG 工程链路搭建和大模型评测,包括使用大模型评测大...

2024-08-05 11:05:35 100

转载 长文本模型近期研究工作梳理

©作者|彭涵机构|中国人民大学研究方向|自然语言处理、大语言模型本文聚焦并总结了当前长文本模型的最新研究进展。引言基于Transformer的大语言模型通常具有有限的上下文窗口,在处理超出上下文窗口长度的文本时会导致性能显著下降,这是因为常见的大语言模型位置编码(如RoPE)在处理超过上下文窗口的文本时会出现分布外(OOD)的情况。现有的长文本模型仍然面临诸多问题:模型在文本长度过长、上下文信息...

2024-08-03 11:05:20 74

转载 全网独一份!AI大模型学习训练资源...(限时免费领)

????分享一个干货满满的「AI大模型公开课」——如何真正应用AI技术,打破工作疲累、AI风口转型困境?2天直播解析✅如何应用和训练AI大模型?利用AI编程提效?✅用 LangChain、Fine-tuning定制你的专属大模型应用✅深度学习指令工程Transformer /Langchain /Fine tuning✅ 如何将AI 技术应用到实际工作场景?✅未来哪些程序员收入会提高?✅...

2024-08-03 11:05:20 71

转载 Llama-3-SynE:实现有效且高效的大语言模型继续预训练

©作者|陈杰‍‍‍机构|中国人民大学研究方向|自然语言处理、大语言模型继续预训练是使语言模型适应特定领域或任务的一种重要方法。为了使继续预训练更具可追溯性,本研究展示了一份技术报告,通过继续预训练显著增强了 Llama-3(8B)的中文语言能力和科学推理能力。为了在增强新能力的同时保持原有能力,我们利用现有数据集并合成高质量数据集,设计了特定的数据混合和数据课程策略。我们将继续预训练后的模型命名...

2024-07-31 11:05:55 139

转载 为什么说大模型训练很难?聊聊预训练的一些经验

作者|罗小黑整理|青稞AIhttps://www.zhihu.com/question/498271491自从Bert网络模型产数量超过3亿规模,当时候只是觉得性能好,没想到GPT系列出来后,GPT-3直接用170B规模的参数量模型精度碾压竞品。接着就是新一轮的竞争了,后面的事情就有点可怕了,Google推出万亿稀疏switch transformer,huawei推出2000亿稠密鹏...

2024-07-31 11:05:55 92

转载 多模态召回模型:混合模态专家模型

✍???? 本文作者:俊广、卓立、凌潼、青萤1. 背景随着在搜索、推荐、广告技术上多年的迭代积累,业界逐步形成了召回(匹配)、粗排、精排这一多阶段的系统架构。其中,召回作为链路的最前端,决定了业务效果的天花板。召回阶段的主要目的是从全量广告库中高效筛选高质量top-k集合给后链路进一步打分&排序。近年来,随着机器学习,尤其是深度学习技术的发展,学术界及工业界已经全面进入到了 model-base...

2024-07-30 11:05:13 87

转载 Llama 405B背后的训练、对齐技术演变路径

随着大模型的飞速发展,在短短一年半间就有了大幅度的技术迭代更新,LoRA,QLoRA,AdaLoRa,ZeroQuant,Flash Attention,DPO等技术效果已经在工业界逐渐得到验证。过去半年又涌现出更多效果更好的技术和模型,从Mamba2,Jamaba,TTT等基座模型,到Dora,LoftQ,GaLore等最新的微调技术;KTO,IPO,SimPO等对齐技术;再到GPTQ,Smoo...

2024-07-30 11:05:13 76

转载 在国外大厂当leader的真实体验!

国外大厂leader的日常生活是怎样的?相信很多人都很好奇这一点,今天分享一位大佬在国外大厂当leader的真实体验,年入几百个,工作生活很惬意,看完后着实让我羡慕不已~作者:Infinity链接:https://www.zhihu.com/question/38972340坐标美国谷歌。生活过于巴适了,容易温水煮青蛙 。周一和周五不用去公司上班,也没有meeting,算下来每周都是4天小长假,想...

2024-07-29 11:06:02 81

转载 Llama 3.1 源模型泄露背后:失手的 GitHub,破碎的 Meta,好在最小参数都能打脸GPT-4o!...

整理 | 华卫 7 月 23 日凌晨,有人爆料,Meta 的新版 Llama 3.1 405 B 在 4chan 上泄露,并在大多数基准测试中击败了 GPT-4o。据爆料人称,Meta 可能会在明天正式发布 Llama 3 系列中最大的参数模型以及 70B 版本。现在,Github 上泄露的 Llama 3.1 模型链接已 404 ,但据网友保存下来的下载链接显示,文件大约 763.84G。据悉,...

2024-07-26 11:05:24 101

转载 分水岭时刻!Llama3.1发布,405B超越闭源GPT-4o

LIama 3.1正式发布,登上大模型王座!在150多个基准测试集中,405B版本的表现追平甚至超越了现有SOTA模型GPT-4o和Claude 3.5 Sonnet。也就是说,这次,最强开源模型即最强模型。在此之前,Llama 3.1已经被多番曝光泄露,如今可以说千呼万唤始出来。从今天开始,模型即可在官网上下载使用,Meta AI应用可在线试玩。更令研究社区赞赏的是发布近100页详细论文,涵盖了...

2024-07-25 11:05:12 57

转载 大模型Infra这些年,从黑铁时代到黄金时代再到白银时代

作者:方佳瑞,清华大学 计算机科学技术博士;腾讯 · 专家工程师。声明:本文已经授权,版权归原作者!原文:https://zhuanlan.zhihu.com/p/708594043越来越多人开始关注大模型,很多做工程开发的同学问我怎么入门大模型训练推理系统软件(俗称大模型Infra)。作为一名曾经后台开发岗位同学,大家的心情我感同身受。近年来国内互联网业务整体低迷,而大模型却在逆势崛起,每天新闻...

2024-07-24 11:05:37 100

转载 2024 META新作:SUM技术进行大规模在线用户表示,提升广告个性化效果

个性化推荐是现代在线广告的基础,既提升了广告主的回报也优化了用户体验。个性化的核心在于对用户的理解,过去主要依赖于人工设计的特征和简化的架构。以深度学习为基础的推荐系统的发展改变了这一格局,其利用复杂的神经网络模型来学习微妙的用户表示。然而,实践中遇到的约束,如训练吞吐量、服务延迟以及主机内存限制,限制了它们对大量用户数据的全效利用。对于像Meta这样的全面系统,它包含大量具有不同特性的模型,每天...

2024-07-22 11:05:54 81

转载 智慧教育+大模型:技术与应用

导读本次的分享会围绕下面五方面展开:1.智慧教育背景及挑战2.教育领域大模型3.产品案例4.思考与展望5.问答环节分享嘉宾|苏喻博士 合肥人工智能研究院 副研究员出品社区|DataFun01背景及挑战1.背景苏喻博士,2011 年 7 月至 2022 年 2 月就职于科大讯飞研究院,历任科大讯飞 AI 教育研究院副院长,AI 研究院认知群教育条线负责人,学习机业务线教研总监,重点负...

2024-07-18 11:05:31 256

转载 谷歌 | 物品-语言大模型推荐系统

TLDR: 当前将大语言模型用于推荐系统存在三方面问题:1)大语言模型不在推荐系统数据上训练,并且推荐数据通常不公开可用。2)用户交互数据通常与自然语言文本模式不同,无法确定大语言模型能否从交互数据中学习到更多的重要知识。3)难以同时适配不同的用例训练。为解决以上限制,本文提出了一个物品语言模型,其由一个物品编码器和一个冻结的大语言模型组成,前者对用户交互信息进行编码以生成与文本对齐后的物品表示,...

2024-07-16 11:05:26 81

转载 【文末赠书】清华汪玉教授团队:首部高效模型压缩与设计专著重磅上市

????今日福利汪玉 宁雪妃 著电子工业出版社-博文视点2024-07-019787121480591 定价: 119.00 元新书推荐|关于本书|本书系统地介绍了高效模型压缩和模型设计的方法,在编写上兼顾理论和实践。本书主体部分详细介绍了模型压缩的方法论,包括高效模块设计、模型剪枝、模型量化、模型二值化、神经网络架构搜索、知识蒸馏几大部分。另外,简要介绍了定制化硬件加速器的设计及大语言模型的加速和压...

2024-07-15 11:05:52 95

转载 从零训练的 1B 以下小模型汇总

知乎:Angry Bugs链接:https://zhuanlan.zhihu.com/p/693252663最好的学习方式莫过于自己从头做一遍。学习大模型的相关知识以来,一直都想从头自己训练一个 1B 以下的模型,感觉这样才算是真的学过了。不过以手头的资源,也只能玩玩儿迷你的小模型了。最近在网上搜了不少资料,主要是 GitHub 上的仓库和 Arxiv 上的 paper,顺便记录在这里。https...

2024-07-15 11:05:52 84

转载 AI Agent + 电商:应用与探索

后台留言『交流』,加入NewBee讨论组导读本文将分享 AIAgent 在电商平台中的探索。主要内容包括:1.LLM 在电商的价值位2.Agent 解决方案3.应用架构介绍4.AI 创新范式5.预期与规划6.问答环节分享嘉宾|王卓隽 1688 AI创新产品及应用负责人出品社区|DataFun01LLM 在电商的价值位首先来介绍大模型所赋予电商领域的一些新特性,AI 在电商模式下的应...

2024-07-11 11:05:54 188

转载 ACL2024 | AI的时空穿越记:大型语言模型共时推理的奇幻之旅!

作者:苏肇辰标题:Living in the Moment: Can Large Language Models Grasp Co-Temporal Reasoning?录取:ACL2024 Main论文链接:https://arxiv.org/abs/2406.09072代码链接:https://github.com/zhaochen0110/Cotempqa单位:苏州大学、上海人工智能实验室????...

2024-07-10 11:05:49 111 1

原创 LEARN:百川大模型在快手推荐中的应用

作者|冯卡门迪整理|NewBeeNLPhttps://zhuanlan.zhihu.com/p/705497209后台留言『交流』,加入NewBee讨论组这一两年推荐的论文工作离不开冷启和长尾问题,就像过去几年离不开序列和多目标一样,所套的壳子也从时序模型发展到对比学习和LLM,更像是“问题长期存在,我们现在有了更好的工具解决”,鸡生蛋与蛋生鸡总是这么的迷人和无所遁形。关于冷启动和长尾推...

2024-07-08 11:05:30 768 1

原创 Meta关于深度学习推荐系统的Scaling Law的研究

作者|番茄爱鸡蛋整理|NewBeeNLPhttps://zhuanlan.zhihu.com/p/688913185大家好,这里是 NewBeeNLP。今天看看 Meta 关于深度学习推荐系统 Scaling Law 的研究。 零、论文信息论文题目:Wukong: Towards a Scaling Law for Large-Scale Recommendation论文链接:http...

2024-07-05 11:05:28 806

转载 价格战、大厂裁员、模型“翻车”……Q2 的AI 圈子可一点都不无聊

整理 | 傅宇琪 夏日的热浪席卷而来,今年第二季度落下帷幕。短短三个月的时间里,AI 领域里发生了翻天覆地的变化:模型发布、大厂裁员、成功上市、“套壳”翻车……这篇推送将带你快速浏览 Q2 人工智能领域里那些不容错过的亮点。 Meta 发布开源大模型 Llama 3 4 月 19 日,Meta 官宣发布了其最先进开源大型语言模型的下一代产品——Llama 3。据悉,Llama 3 在 2...

2024-07-03 11:05:17 434

转载 抖音Sigir2024兴趣时钟:时间感知流失推荐系统

作者|zsil整理|NewBeeNLPhttps://zhuanlan.zhihu.com/p/701415099用户的个性化兴趣偏好会随着一天中时间流逝而变化,例如短视频平台,早上9点用户可能偏好资讯类短视频,而晚上21点用户可能偏好娱乐类短视频;音乐平台,早上9点用户可能偏好DJ,而晚上21点偏好助眠类音乐。然而现有的大部分推荐系统的工作仅关注用户静态的兴趣偏好,忽略了用户偏好在一天...

2024-07-02 11:05:12 63

转载 聊一聊大模型应用落地那些事

作者|混沌福王整理|NewBeeNLPhttps://mp.weixin.qq.com/s/IncGbYB7t7m5UNN4Lgi14A本文是一篇内部的个人分享(已无敏感信息) ,目的是增加产品、开发同学对 LLM 的理解, 以降低沟通中的阻力,更好推进落地。以下经脱敏后的原文:大模型并不神奇很多人听到"大模型"这个词可能会觉得很神秘,其实,LLM 就是神经网络,只是很大的神经网络,相对...

2024-06-28 11:05:56 59

转载 用户检索增强的大模型跨域推荐

TLDR: 针对传统跨域推荐中存在的语义缺失问题,本文提出一种新颖的双图大模型跨域推荐方法来捕捉多样化的信息,并采用对齐和对比学习方法促进领域知识转移。论文:https://arxiv.org/pdf/2406.03085代码:https://github.com/TingJShen/URLLM跨域序列推荐旨在挖掘和迁移用户在不同域之间的序列偏好,以缓解长期存在的冷启动问题。传统的跨域序列推荐模型...

2024-06-27 11:05:41 73

转载 Top2暑期实习反思:开发和算法的分岔路

作者|歪门正道整理|NewBeeNLPhttps://zhuanlan.zhihu.com/p/694319236暑期实习基本告一段落,我和实验室同届的好哥们都找到了去处,我准备做开发,他准备做算法,境遇也许并不相同,以此来反思自己的心路历程和总结下过去一两年的思考。算法转开发竞争优势:top2学校里不乏高中信息竞赛、大学ACM选手,和这些同学比编程很难胜出。但是在AI领域大家都是新手...

2024-06-26 11:05:50 73

转载 技术分享:领域大模型的挑战与机遇

大家好,这里是 NewBeeNLP。本文将介绍复旦大学知识工场实验室关于领域大模型的研究工作。主要内容包括以下几大部分:1.背景2.大模型的领域适配3.大模型的能力提升4.大模型的协同工作分享嘉宾|梁家卿博士复旦大学青年副研究员出品社区|DataFun01背景来自 GPT4 的技术报告中指出,GPT4 仍处于通用人工智能(AGI)的初级阶段。而目前研发中的 GPT4.5 或 GPT5...

2024-06-24 11:05:20 58

转载 LEARN: LLM在快手电商广告推荐场景的应用

作者|Lukan整理|NewBeeNLP今天继续分享一篇大模型在推荐系统中的落地应用工作,是快手今年5月份发表的论文《Knowledge Adaptation from Large Language Model to Recommendation for Practical Industrial Application》。太长不看版这篇文章主要做了两个工作:工作1:使用冻结的LLM提取...

2024-06-20 11:05:31 437

ACL2020论文大全

ACL2020顶会论文打包下载,摘要必须大于50字,怎么还没到50字,我真的不知道说什么了,现在大概快到50字了吧,到了吗

2020-09-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除