- 博客(376)
- 收藏
- 关注
原创 心法利器[114] | 通用大模型文本分类实践(含代码)
心法利器本栏目主要和大家一起讨论近期自己学习的心得和体会。具体介绍:仓颉专项:飞机大炮我都会,利器心法我还有。2023年新的文章合集已经发布,获取方式看这里:又添十万字-CS的陋室2023年文章合集来袭,更有历史文章合集,欢迎下载。往期回顾心法利器[109] | RAG效果评估经验心法利器[110] | 知识文档处理和使用流程心法利器[111] | 近期RAG技术总结和串讲(4w字RAG文章纪念)...
2024-07-21 21:00:44 576
原创 前沿重器[48-54] 合集:四万字聊搜索系统
前沿重器栏目主要给大家分享各种大厂、顶会的论文和分享,从中抽取关键精华的部分和大家分享,和大家一起把握前沿技术。具体介绍:仓颉专项:飞机大炮我都会,利器心法我还有。(算起来,专项启动已经是20年的事了!)2023年文章合集发布了!在这里:又添十万字-CS的陋室2023年文章合集来袭经过自己连续两个月的努力,终于把搜索系统的完整讲解给写完了。下面是文章的合集内容,系统讲解了搜索系统中各个部分的工作以...
2024-07-15 00:00:57 951
原创 前沿重器[54] | 聊聊搜索系统7:补充模块
前沿重器栏目主要给大家分享各种大厂、顶会的论文和分享,从中抽取关键精华的部分和大家分享,和大家一起把握前沿技术。具体介绍:仓颉专项:飞机大炮我都会,利器心法我还有。(算起来,专项启动已经是20年的事了!)2023年文章合集发布了!在这里:又添十万字-CS的陋室2023年文章合集来袭往期回顾前沿重器[49] | 聊聊搜索系统2:常见架构前沿重器[50] | 聊聊搜索系统3:文档内容处理前沿重器[51...
2024-07-14 22:08:44 828
转载 20240711送书活动结果
书接上回,7月11日有文末送书的活动。(【文末送书】AIGC时代程序员的跃迁——编程高手的密码武器)本次送书是送2本,这次有两位同学并列第二,如下图所示。请这3位同学,在7月15日晚上前加我的微信(zgr950123)。后面并列第二的同学我会通过红包抽奖的方式决出最终获得书的幸运儿,发我快递地址,我会尽快安排送书,过期我会继续找下一位替补哈~没获奖的同学不要灰心,下次还有机会,敬请期待!...
2024-07-14 22:08:44 10
转载 【文末送书】AIGC时代程序员的跃迁——编程高手的密码武器
在这个迅速变化的时代,AI技术已经渗透到我们生活的方方面面,尤其是在软件开发领域。我们作为《AIGC辅助软件开发:ChatGPT 10倍效率编程实战》一书的团队,也是在实践AIGC中积累了大量的经验, 和大家一同分享。AIGC除了在文字对话,生成文档方面有突出的表现,它渊博的知识,也为解决很多项目中的疑难问题提供了极大的帮助。以下给大家分享真实项目中发生的例子。案例 利用ChatGPT解决实际转码...
2024-07-11 08:00:48 23
原创 前沿重器[53] | 聊聊搜索系统6:精排
前沿重器栏目主要给大家分享各种大厂、顶会的论文和分享,从中抽取关键精华的部分和大家分享,和大家一起把握前沿技术。具体介绍:仓颉专项:飞机大炮我都会,利器心法我还有。(算起来,专项启动已经是20年的事了!)2023年文章合集发布了!在这里:又添十万字-CS的陋室2023年文章合集来袭往期回顾前沿重器[48] | 聊聊搜索系统1:开篇语前沿重器[49] | 聊聊搜索系统2:常见架构前沿重器[50] |...
2024-07-09 00:10:36 875
转载 实战Llama-3-70B RLHF-PPO训练耗时及成本
我是小冬瓜AIGC,原创超长文知识分享原创课程已帮助多名同学上岸LLM赛道知乎/小红书:小冬瓜AIGC按照scaling law,越大的模型性能也越好同时训练的难度也大幅提升以下基于Llama-3-70B模型训练,对比SFT/PPO训练耗时运算平台为A800(80G)x8总体训练耗时<2天上述为课程的实操结果可复现,更多课程内容详情如下:一、课程概况课程内容:直播 + 往期录播+ 手撕...
2024-07-01 12:00:46 97
原创 前沿重器[52] | 聊聊搜索系统5:召回:检索、粗排、多路召回
前沿重器栏目主要给大家分享各种大厂、顶会的论文和分享,从中抽取关键精华的部分和大家分享,和大家一起把握前沿技术。具体介绍:仓颉专项:飞机大炮我都会,利器心法我还有。(算起来,专项启动已经是20年的事了!)2023年文章合集发布了!在这里:又添十万字-CS的陋室2023年文章合集来袭往期回顾前沿重器[47] | RAG开源项目Qanything源码阅读3-在线推理前沿重器[48] | 聊聊搜索系统1...
2024-06-30 20:55:52 329
原创 前沿重器[51] | 聊聊搜索系统4:query理解
前沿重器栏目主要给大家分享各种大厂、顶会的论文和分享,从中抽取关键精华的部分和大家分享,和大家一起把握前沿技术。具体介绍:仓颉专项:飞机大炮我都会,利器心法我还有。(算起来,专项启动已经是20年的事了!)2023年文章合集发布了!在这里:又添十万字-CS的陋室2023年文章合集来袭往期回顾前沿重器[46] RAG开源项目Qanything源码阅读2-离线文件处理前沿重器[47] | RAG开源项目...
2024-06-23 21:00:28 766
转载 无脑Scaling!2天训完 70B RLHF-PPO
我是小冬瓜AIGC,原创超长文知识分享原创课程已帮助多名同学上岸LLM赛道知乎/小红书:小冬瓜AIGC按照scaling law,越大的模型性能也越好同时训练的难度也大幅提升以下基于Llama-3-70B模型训练,对比SFT/PPO训练耗时运算平台为A800(80G)x8总体训练耗时<2天上述为课程的实操结果可复现,更多课程内容详情如下:一、课程概况课程内容:直播 + 往期录播+ 手撕...
2024-06-18 21:00:53 47
原创 前沿重器[50] | 聊聊搜索系统3:文档内容处理
前沿重器栏目主要给大家分享各种大厂、顶会的论文和分享,从中抽取关键精华的部分和大家分享,和大家一起把握前沿技术。具体介绍:仓颉专项:飞机大炮我都会,利器心法我还有。(算起来,专项启动已经是20年的事了!)2023年文章合集发布了!在这里:又添十万字-CS的陋室2023年文章合集来袭往期回顾前沿重器[45] RAG开源项目Qanything源码阅读1-概述+服务前沿重器[46] RAG开源项目Qan...
2024-06-16 21:52:48 338
原创 前沿重器[49] | 聊聊搜索系统2:常见架构
前沿重器栏目主要给大家分享各种大厂、顶会的论文和分享,从中抽取关键精华的部分和大家分享,和大家一起把握前沿技术。具体介绍:仓颉专项:飞机大炮我都会,利器心法我还有。(算起来,专项启动已经是20年的事了!)2023年文章合集发布了!在这里:又添十万字-CS的陋室2023年文章合集来袭往期回顾前沿重器[44] | Adaptive-RAG:根据难度自适应检索方案前沿重器[45] RAG开源项目Qany...
2024-06-10 21:00:25 882
原创 前沿重器[48] | 聊聊搜索系统1:开篇语
前沿重器栏目主要给大家分享各种大厂、顶会的论文和分享,从中抽取关键精华的部分和大家分享,和大家一起把握前沿技术。具体介绍:仓颉专项:飞机大炮我都会,利器心法我还有。(算起来,专项启动已经是20年的事了!)2023年文章合集发布了!在这里:又添十万字-CS的陋室2023年文章合集来袭往期回顾前沿重器[43] | 谷歌中科院新文:CRAG-可矫正的检索增强生成前沿重器[44] | Adaptive-R...
2024-06-02 21:05:51 740
转载 LoRA不香了,小小Llama-3全参训练,拿下!!
我是小冬瓜AIGC,原创超长文知识分享原创课程已帮助多名同学上岸LLM赛道知乎/小红书:小冬瓜AIGC基于Llama-3-8B预训练模型全参SFT微调中文问答轻松秒了ruozhiba经过DPO/PPO强化学习训练便可胜任代码生成/中英文安全对话Llama-3-8B-PPO 代码生成:Llama-3-8B-PPO 中文问答实例:本效果为课程的实操实际结果可复现,更多课程内容详情如下:一、课程概况课...
2024-05-31 12:01:16 54
转载 又一篇AI顶会!这个idea简直“ 杀疯了 ”
一个好的idea就能决定文章是CCF A会的水平还是CCF C会的水平。所以那些科研大佬,A会、B会一年发个六七篇,靠的都是极具创新性的idea。但科研新手靠自己根本挖掘不到,最多是魔改。因此:今天分享一套我学过后收获很大的科研课程。这套课程由多位Best Paper得主共同设计。像素级拆解了顶会顶刊idea设计思路、论文结构、写作套路。还从AC审稿人角度出发,告诉你顶会顶刊不能踩的雷,以及如何写...
2024-05-29 12:02:47 33
原创 前沿重器[47] | RAG开源项目Qanything源码阅读3-在线推理
前沿重器栏目主要给大家分享各种大厂、顶会的论文和分享,从中抽取关键精华的部分和大家分享,和大家一起把握前沿技术。具体介绍:仓颉专项:飞机大炮我都会,利器心法我还有。(算起来,专项启动已经是20年的事了!)2023年文章合集发布了!在这里:又添十万字-CS的陋室2023年文章合集来袭往期回顾前沿重器[41] | 综述-面向大模型的检索增强生成(RAG)前沿重器[42] | self-RAG-大模型决...
2024-05-26 21:00:34 507
原创 前沿重器[46] RAG开源项目Qanything源码阅读2-离线文件处理
前沿重器栏目主要给大家分享各种大厂、顶会的论文和分享,从中抽取关键精华的部分和大家分享,和大家一起把握前沿技术。具体介绍:仓颉专项:飞机大炮我都会,利器心法我还有。(算起来,专项启动已经是20年的事了!)2023年文章合集发布了!在这里:又添十万字-CS的陋室2023年文章合集来袭往期回顾前沿重器[41] | 综述-面向大模型的检索增强生成(RAG)前沿重器[42] | self-RAG-大模型决...
2024-05-14 21:21:48 1059
转载 【Llama-3】从SFT到RLHF训练,易如反掌
推荐下朋友【知乎/小红书:小冬瓜AIGC】原创的LLM+RLHF视频课程,他在知乎和小红书也分享了很多关于LLM相关的技术文章和笔记,原创不易,感兴趣的朋友可以关注下。作者是小冬瓜AIGC,原创超长文知识分享原创课程已帮助多名同学上岸LLM赛道知乎/小红书:小冬瓜AIGC基于Llama-3-8B预训练模型全参SFT微调中文问答轻松秒了ruozhiba经过DPO/PPO强化学习训练便可胜任代码生成...
2024-05-13 12:01:01 149
原创 前沿重器[45] RAG开源项目Qanything源码阅读1-概述+服务
前沿重器栏目主要给大家分享各种大厂、顶会的论文和分享,从中抽取关键精华的部分和大家分享,和大家一起把握前沿技术。具体介绍:仓颉专项:飞机大炮我都会,利器心法我还有。(算起来,专项启动已经是20年的事了!)2023年文章合集发布了!在这里:又添十万字-CS的陋室2023年文章合集来袭往期回顾前沿重器[40] | 高级RAG技术——博客阅读前沿重器[41] | 综述-面向大模型的检索增强生成(RAG)...
2024-05-04 21:00:38 1038
原创 心法利器[113] | RAG结构思考:搜索系统范式和大模型作用压缩
心法利器本栏目主要和大家一起讨论近期自己学习的心得和体会。具体介绍:仓颉专项:飞机大炮我都会,利器心法我还有。2023年新的文章合集已经发布,获取方式看这里:又添十万字-CS的陋室2023年文章合集来袭,更有历史文章合集,欢迎下载。往期回顾心法利器[108] | 微调与RAG的优缺点分析心法利器[109] | RAG效果评估经验心法利器[110] | 知识文档处理和使用流程心法利器[111] | ...
2024-04-21 22:00:22 633
转载 20240415送书活动结果
书接上回,4月15日有文末送书的活动。(【文末送书】京东新书榜第1名 | 张亚勤、翟成祥、李航重磅推荐,开启智能检索新纪元!)本次送书是送3本,让我们恭喜前3名同学!请这3位同学,在4月20日晚上前加我的微信(zgr950123),发我快递地址,我会尽快安排送书,过期我会继续找下一位替补哈~没获奖的同学不要灰心,下次还有机会,敬请期待!...
2024-04-19 08:30:18 38 1
转载 【文末送书】京东新书榜第1名 | 张亚勤、翟成祥、李航重磅推荐,开启智能检索新纪元!...
在这个信息爆炸的时代,获取、理解和应用信息变得愈发重要。也正是在这个背景下,郭嘉丰、兰艳艳和程学旗三位作者共同打造了《信息检索与深度学习》这本开创性之作,不同于大厚本的臃肿,这本书以其紧凑的结构,将信息检索的核心知识和深度学习的前沿技术浓缩于掌中,为学术追求者和行业从业者提供了无比珍贵的参考!《信息检索与深度学习》郭嘉丰,兰艳艳,程学旗 | 著本书以信息检索系统架构为引导,探讨了神经检索前沿技术,...
2024-04-15 08:30:53 56 1
转载 20240411送书活动结果
书接上回,4月11日有文末送书的活动。(【文末赠书】《冷启动》:如何低成本搞定用户增长?)本次送书是送2本,让我们恭喜前2名同学!请这2位同学,在4月16日晚上前加我的微信(zgr950123),发我快递地址,我会尽快安排送书,过期我会继续找下一位替补哈~没获奖的同学不要灰心,下次还有机会,敬请期待!...
2024-04-15 08:30:53 34
原创 前沿重器[44] | Adaptive-RAG:根据难度自适应检索方案
前沿重器栏目主要给大家分享各种大厂、顶会的论文和分享,从中抽取关键精华的部分和大家分享,和大家一起把握前沿技术。具体介绍:仓颉专项:飞机大炮我都会,利器心法我还有。(算起来,专项启动已经是20年的事了!)2023年文章合集发布了!在这里:又添十万字-CS的陋室2023年文章合集来袭往期回顾前沿重器[39] | 对话式推荐系统——概念和技术点前沿重器[40] | 高级RAG技术——博客阅读前沿重器[...
2024-04-14 21:02:11 726
转载 【手撕LLM+RLHF】谁懂70B RLHF的含金量啊?
推荐下朋友【知乎/小红书:小冬瓜AIGC】原创的LLM+RLHF视频课程,他在知乎和小红书也分享了很多关于LLM相关的技术文章和笔记,原创不易,感兴趣的朋友可以关注下。我是小冬瓜AIGC,原创超长文知识分享原创课程已帮助多名同学上岸LLM赛道知乎/小红书???? :小冬瓜AIGC如何能快速提升LLM模型性能,一个无脑的做法是Scaling更大的模型但70B的调试难度、训练成本和工程难度大大提升撸完70B...
2024-04-12 10:00:07 166
转载 【文末赠书】《冷启动》:如何低成本搞定用户增长?
前言:安德鲁·陈(Andrew Chen)是硅谷风投巨头安德森-霍茨基金合伙人,曾任优步增长副总裁,他在其博客发表多篇有关产品、增长、营销和网络效应的文章,曾被《连线》《华尔街日报》和《纽约时报》报道。最近他的新书《冷启动》上市,解答了有关 “网络效应”的各类相关问题,为初创企业从零开始实现用户增长,提供了一些思路。《冷启动》:如何低成本搞定用户增长?作者:安德鲁·陈(Andrew Chen)来源...
2024-04-11 08:30:51 42
原创 心法利器[112] | 考古RAG-20年RAG概念提出的论文
心法利器本栏目主要和大家一起讨论近期自己学习的心得和体会。具体介绍:仓颉专项:飞机大炮我都会,利器心法我还有。2023年新的文章合集已经发布,获取方式看这里:又添十万字-CS的陋室2023年文章合集来袭,更有历史文章合集,欢迎下载。往期回顾心法利器[107] onnx和tensorRT的bert加速方案记录心法利器[108] | 微调与RAG的优缺点分析心法利器[109] | RAG效果评估经验心...
2024-04-06 22:36:26 827
转载 手撕RLHF-PPO Notebook
我是小冬瓜AIGC,原创超长文知识分享原创课程已帮助多名同学上岸LLM赛道知乎/小红书???? :小冬瓜AIGC LLM中的RLHF-PPO算法复杂, 容易劝退进阶的朋友逐行手撕LLM中的PPO算法成功后,我建议不依赖任何RL库,主要通过Pytorch实现:4个模型:Ref/Actor/Critic/RewardPPO采样及训练流程Loss计算Actor Loss+Critic Loss+Entro...
2024-04-02 10:00:27 219
转载 20240329送书活动结果
书接上回,3月29日有文末送书的活动。(【文末赠书】一本教你基于大语言模型进行商业应用开发的书)本次送书是送3本,让我们恭喜前3名同学!请这3位同学,在4月2日晚上前加我的微信(zgr950123),发我快递地址,我会尽快安排送书,过期我会继续找下一位替补哈~没获奖的同学不要灰心,下次还有机会,敬请期待!...
2024-04-01 22:23:04 31
转载 【文末赠书】一本教你基于大语言模型进行商业应用开发的书
文末赠书喜欢AI,对ChatGPT超级好奇,但被市面上爆增的大模型书籍和教学视频弄得眼花缭乱?没事!Datawhale团队最新推出的“蝴蝶书”——《ChatGPT原理与应用开发》来啦!这本书源自Datawhale开源项目HuggingLLM,GitHub 2K+星、B站播放量超30万,是Datawhale在打造了“南瓜书”“蘑菇书”“熊猫书”后,推出的第4本王牌之作。扫码5折购书,限100人翻开《...
2024-03-29 08:00:57 29
原创 心法利器[111] | 近期RAG技术总结和串讲(4w字RAG文章纪念)
心法利器本栏目主要和大家一起讨论近期自己学习的心得和体会。具体介绍:仓颉专项:飞机大炮我都会,利器心法我还有。2023年新的文章合集已经发布,获取方式看这里:又添十万字-CS的陋室2023年文章合集来袭,更有历史文章合集,欢迎下载。往期回顾心法利器[106] 基础RAG-调优方案心法利器[107] onnx和tensorRT的bert加速方案记录心法利器[108] | 微调与RAG的优缺点分析心...
2024-03-25 21:36:07 741
原创 心法利器[110] | 知识文档处理和使用流程
心法利器本栏目主要和大家一起讨论近期自己学习的心得和体会。具体介绍:仓颉专项:飞机大炮我都会,利器心法我还有。2023年新的文章合集已经发布,获取方式看这里:又添十万字-CS的陋室2023年文章合集来袭,更有历史文章合集,欢迎下载。往期回顾心法利器[105] 基础RAG-大模型和中控模块代码(含代码)心法利器[106] 基础RAG-调优方案心法利器[107] onnx和tensorRT的ber...
2024-03-24 21:00:59 910
原创 心法利器[109] | RAG效果评估经验
心法利器本栏目主要和大家一起讨论近期自己学习的心得和体会。具体介绍:仓颉专项:飞机大炮我都会,利器心法我还有。2023年新的文章合集已经发布,获取方式看这里:又添十万字-CS的陋室2023年文章合集来袭,更有历史文章合集,欢迎下载。往期回顾心法利器[103] | 大模型bad case修复方案思考心法利器[104] | 基础RAG-向量检索模块(含代码)心法利器[105] 基础RAG-大模型和中...
2024-03-18 21:00:08 1014
转载 【再招聘】OPPO招大模型/NLP实习生
之前的实习生招聘仍旧生效:【招聘】OPPO大模型相关实习生同样是老东家,来自另一个小组的实习生岗位信息,有兴趣也可以直接联系。两个岗位会有区别,上面这个会更倾向于大模型的训练、优化,例如微调、强化学习等,这篇文章介绍的,会更偏向于应用,如agent、知识工程、prompt、function call等,大家可以根据自己的兴趣选择。下面是本文JD。职位名称:NLP算法工程师(大模型应用方向)职位描述...
2024-03-13 09:00:14 47
原创 心法利器[108] | 微调与RAG的优缺点分析
心法利器本栏目主要和大家一起讨论近期自己学习的心得和体会。具体介绍:仓颉专项:飞机大炮我都会,利器心法我还有。2023年新的文章合集已经发布,获取方式看这里:又添十万字-CS的陋室2023年文章合集来袭,更有历史文章合集,欢迎下载。往期回顾心法利器[103] | 大模型bad case修复方案思考心法利器[104] | 基础RAG-向量检索模块(含代码)心法利器[105] 基础RAG-大模型和中...
2024-03-03 22:55:41 1051
原创 前沿重器[43] | 谷歌中科院新文:CRAG-可矫正的检索增强生成
前沿重器栏目主要给大家分享各种大厂、顶会的论文和分享,从中抽取关键精华的部分和大家分享,和大家一起把握前沿技术。具体介绍:仓颉专项:飞机大炮我都会,利器心法我还有。(算起来,专项启动已经是20年的事了!)2023年文章合集发布了!在这里:又添十万字-CS的陋室2023年文章合集来袭往期回顾前沿重器[38] | 微软新文query2doc:用大模型做query检索拓展前沿重器[39] | 对话式推荐...
2024-02-25 21:02:00 1046
转载 【招聘】OPPO大模型相关实习生
帮我的老东家转发一份实习生招聘信息,就在我原来的小组,机会还挺不错的,有兴趣可以了解一下。OPPO大模型相关实习生(NLP算法工程师)base:深圳北京岗位职责:参与基于大语言模型的相关研发,包括但不限于预训练、指令微调、奖励模型、强化学习或文本生成、信息抽取、工具和插件使用、对话决策等;参与数据预处理、特征工程、模型训练和优化等工作;参与团队内部的技术分享和交流,不断提升自己的技术水平;任职要求...
2024-02-22 21:26:54 54
转载 【文末送书】做推荐算法在大厂有多吃香
文末赠书Part.1做推荐算法在大厂有多吃香?小异最近听说一位做推荐算法的同学通过面试,顺利入职某大厂核心盈利部门,真是太羡慕他了。为什么会推荐算法就能在大厂这么吃香?因为大厂要依靠推荐系统来变现。例如,电商企业要向用户推荐最需要的商品;视频流媒体平台要向用户推送最喜欢的内容;社交新闻媒体平台要让用户看到最感兴趣的信息……因此,推荐系统和企业的收入直接相关,推荐算法做得好,企业就可以更好地理解用...
2024-02-21 08:00:40 41
转载 高效快速卷一篇top期刊高质量论文
如果你的导师属于第一个课题就让你自己找,没钱,没资源,也没法做指导,唯一会的技能就是问进度的话!那么,你有idea(创新点)就发,别管水不水。没有idea,来研梦非凡!原始idea是重要的!写作表达也很重要。很多同学可能不知道idea是什么,做科研的流程有什么步骤,没有科研经历,导师和上面讲的一样,写论文也没可以手把手指点的人。来看研梦非凡的《论文写作指导课》,7节课带你从读论文⌈学会发现idea...
2024-02-20 08:30:22 57
原创 心法利器[107] onnx和tensorRT的bert加速方案记录
心法利器本栏目主要和大家一起讨论近期自己学习的心得和体会,与大家一起成长。具体介绍:仓颉专项:飞机大炮我都会,利器心法我还有。2023年新一版的文章合集已经发布,获取方式看这里:又添十万字-CS的陋室2023年文章合集来袭,更有历史文章合集,欢迎下载。往期回顾心法利器[102] | 大模型落地应用架构的一种模式心法利器[103] | 大模型bad case修复方案思考心法利器[104] | 基础R...
2024-02-14 21:00:28 1226
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人