自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(27)
  • 收藏
  • 关注

原创 零基础学深度学习必备学哪些框架?PyTorch 和 TensorFlow 选哪个?完整指南

优势:零基础友好教学(从Python起步,通俗讲解PyTorch/TensorFlow),实战项目导向(带你做10+项目,如CNN检测、Transformer生成),个性化学习规划(我1v1评估你的背景,定制路线),带练答疑(小班直播,每周反馈bug)。这些年,我辅导过数百名非计算机专业的学员入门深度学习,从财务、销售、教师到文员背景,他们中很多人一开始连编程都没碰过,但通过正确的路径和框架选择,几个月就上手了模型训练、项目落地,甚至拿到了算法助理或数据工程师的offer。为什么入门必学:稳定,工业级。

2026-04-13 17:05:47 25

原创 深度学习的完整学习路径是什么?看这一篇就够了

项目实践(核心)、PyTorch(框架)性价比最高的是、Python(工具):。从程序员小白到算法工程师我带过上千名学员从零基础转行深度学习领域我是唐宇迪、大家好,,,,数据科学家这些年甚至是大厂AI岗位,。、,简历点零基础最短路径面试准备)、我会用通俗语言讲清企业真正要什么技能、项目、、帮你避坑分阶段内容(每个阶段配时间快出成果、。、、、:时间规划学什么、、简历成果输出(项目面试)每个阶段突出怎么学为什么学、。求职(冲刺)路径分5阶段:、、基础(建模)实战(项目)入门(打基)、、进阶(优化)。

2026-04-13 17:03:40 143

原创 新手必读:新手小白学习人工智能,推荐哪些入门书籍和课程?适合零基础的有哪些?

标签:#人工智能、#深度学习、#自然语言处理、#神经网络、#机器学习、#计算机视觉、#ai。

2026-04-13 17:01:52 45

原创 斯坦福CS146S作业全解析:从Prompt到Agent实战

2025 年秋季,斯坦福计算机系出现了一门排课火爆的新课 —— CS146S: The Modern Software Developer(现代软件开发者)。这门课由 Mihail Eric 主讲,他是斯坦福校友,曾在 Amazon Alexa 担任技术主管,创办过 YC 孵化的 AI 编程公司,如今重返母校,开设了斯坦福历史上第一门专注于 AI 软件开发的课程。课程从 9 月 22 日开始,为期十周,每周两次课。

2026-04-13 17:01:04 125

原创 全网最全:零基础学深度学习需要学哪些框架?PyTorch 和 TensorFlow 选哪个?

优势:零基础友好教学(从Python起步,通俗讲解PyTorch/TensorFlow),实战项目导向(带你做10+项目,如CNN检测、Transformer生成),个性化学习规划(我1v1评估你的背景,定制路线),带练答疑(小班直播,每周反馈bug)。这些年,我辅导过数百名非计算机专业的学员入门深度学习,从财务、销售、教师到文员背景,他们中很多人一开始连编程都没碰过,但通过正确的路径和框架选择,几个月就上手了模型训练、项目落地,甚至拿到了算法助理或数据工程师的offer。为什么入门必学:稳定,工业级。

2026-04-13 16:59:18 204

原创 从零到CV算法工程师:25篇文章带你突破面试关

一直有同学问我面试的事儿,我没急着写。因为面试这东西,说太细容易引发焦虑,而且每个人情况不同。不过有些经验是通用的,今天分享给大家。

2026-04-13 16:58:44 148

原创 ReAct模式进阶:从单步推理到多步规划

适合需要工具辅助的任务(查资料、跑数据库、复杂计算等;优点是推理轨迹清晰,便于追溯;缺点是推理链过长可能导致延迟上升,需限制循环步数。最近两年,大家都可以看到AI的发展有多快,我国超10亿参数的LLM,在短短一年之内,已经超过了100个,现在还在不断的发掘中,时代在瞬息万变,我们又为何不给自己多一个选择,多一个出路,多一个可能呢?与其在传统行业里停滞不前,不如尝试一下新兴行业,而AILLM恰恰是这两年的大风口,整体AI领域预计缺口1000万人,其中算法、工程应用类人才需求最为紧迫!

2026-04-13 16:56:23 106

原创 CS146S课程解析:LLM上限就是开发者的上限

第 6 周:AI 测试与安全安全编码在 AI 时代变得更加重要。本周覆盖 SAST、DAST、漏洞检测、AI 生成的测试用例,以及如何用 Semgrep 等工具进行安全扫描。第 7 周:现代软件支持AI 代码审查、智能文档生成、调试辅助。如何建立对 AI 生成代码的信任?如何设置 Code Review 流程来捕捉 AI 的错误和Hallucination?第 8 周:自动化 UI 构建用一个 Prompt 生成完整的 Web App。快速原型、设计普惠化、端到端应用构建。

2026-04-13 16:54:52 194

原创 AI辅助debug:调试辅助工具大盘点

【本段核心】LLMs are only as good as you are. (LLM 的上限就是你的上限)如果有人说"AI 在我的代码库上不好用",通常意味着即便是一个人类新手进入这个代码库也会一头雾水。难题不在 AI,在于代码本身缺乏清晰的结构和上下文。【本段核心】这种思维方式的转变,正是这门课最独特的地方——它不是在教工具,而是在教新时代的工作方式。【本段核心】二、十周课程:从原理到实战课程设计覆盖了 AI 辅助研发的完整生命周期。

2026-04-13 16:53:22 256

原创 AI Agent方向简历项目数量多少合适

简单说就是你拿到offer后能不能快速上手干活儿做项目,至于学历背景,本科以上基本满足大部分公司的绝大部分职业方向门槛了。下面我直接把我当时走通的路线讲明白,你照这个节奏去做,基本不会偏。刚开始我也是无从下手,眉毛胡子一把抓,今天学Prompt,明天学LangChain,后天看RAG,学完感觉懂了,一到上手做就做不出来。我就是双非野鸡二本经济学转Agent的,成效把 Agent 这条路跑通之后,简历项目亮点直接写满,后面成功拿到offer30kLLM工作最近还发了2w多的年终奖,舒坦!

2026-04-13 16:51:51 213

原创 AI Agent实习面试高频问题100道

这些实际上更像工程问题,公司愿意给30k月薪的原因就在这里,Agent开发不是玩具技术人,是能把玩具变成生产力的人。这环节最直接有效的方法就是跟着项目完整走一遍,如果你无从下手,趁着有大佬带队,你直接跟着做就行。我就是跟着这个「Agent 从入门到实战」学的,技术大佬带你手搓企业级项目全流程,手把手带你做出一个能用的Agent系统,简历项目经验就有了。3.把Agent做成能交付的系统很多人到这里就卡壳了,Demo跑得飞起,但一上强度就不稳定。

2026-04-13 16:50:21 212

原创 大模型应用开发入门:PyTorch和CUDA环境配置实战指南

自然语言处理(Natural Language Processing,NLP),包括文本分类、命名实体识别、问答、语言建模、摘要、翻译、多项选择和文本生成等任务场景。计算机视觉(Computer Vision,CV),包括图像分类、目标检测等任务场景音频处理(Audio),包括自动语音识别和音频分类等任务场景。多模态(Multimodal),包括表格问答、光学字符识别、从扫描文档提取信息、视频分类和视觉问答等任务场景Gradio,用于快速创建交互式 UI,以便展示和演示机器学习模型的工作方式。

2026-04-07 14:01:47 23

原创 大模型应用开发从入门到实战:完整教程

标签:#人工智能、#大模型、#自然语言处理、#大模型开发、#智能体开发、#agent开发、#AI。

2026-04-07 14:01:45 38

原创 大模型应用层:硕士能吃到的人口红利

这时候能快速搭建可落地的解决方案的人就特别吃香,可能只需要把开源模型微调下,做个增强检索,再设计好业务流程中的提示词,就能解决他们80%的痛点。当下的大模型落地进程,依然处于初期阶段,正是百废待兴的时候。尤其B端,现在很多企业的情况很有意思,手里攥着预算想搞智能化,但既不敢all in大模型,又不甘心只做表面功夫。但是算法的话还是算了吧,你去看看那些大厂算法岗招聘,清一色要求顶会论文+名校PhD,现在这行情,要是没个PhD头衔,连训练模型的显卡都摸不着。Java就算了吧,太卷了,尤其现在大环境下,更卷了。

2026-04-07 14:01:42 13

原创 大模型幻觉问题:RAG检索增强与约束生成解决方案

这样更可靠、更容易解析。语料切分:项目中的关系抽取任务是句子级关系抽取,传统的句子级关系抽取数据集每条样本的句子长度是几十个Token。我在项目中使用的自建数据集,质量一般,实体关系密度较低,如果按照传统句子级关系抽取的窗口来切分语料,会导致关系样本量不足。计算方法:首先利用 Embedding 模型(如 BGE 或 OpenAI-text-embedding)对某个关系类别下的所有样本句子进行向量化,然后对这些高维向量求均值(Mean Pooling),得到该类别的“质心向量”来代表这个关系的原型。

2026-04-07 14:01:40 22

原创 大模型工程师养成计划:6步实现技术跃迁

注意事项:1、不建议用Ollama等量化工具部署模型,因为5分钟就学会了,让人误以为大模型部署不过如此,其实Q4量化的精度很低,不适合用于生产环境。学习大模型,实践是非常重要的,所以首先得有显卡,可以购买,也可以在各种云平台上短租,具备此条件,然后再学习,才能达到事半功倍的效果。5、学习RAG技术,先学习部署Dify等产品,然后学习langchain、llamaindex等。3、学习微调大模型,了解全量微调、LoRA微调、SFT、强化训练等基础理论,实践LoRA微调。

2026-04-07 14:01:37 13

原创 大模型岗位日常工作大揭秘:不是在训练模型

你需要懂很多模型原理,会调参,会做特征工程,能把一堆原始数据,通过复杂的工序,炼成一个能用的“丹”,也就是模型。他们的核心任务变了,变成了:如何用好这些现成的、强大的“布料”,去做出能解决自己业务问题、能赚钱的“衣服”(应用)。现在的“算法岗”,其实是个“岗位簇”现在大家嘴里说的“算法工程师”或者“AI工程师”,已经不是一个单一的岗位了,它其实分化成了好几个差异巨大的方向。你这个问题,我先给个结论,一个可能会让你有点意外但绝对是现实的结论:你遇到的情况,不是特例,而是正在迅速成为行业的主流和新常态。

2026-04-07 14:01:35 12

原创 大模型岗位分类金字塔:你在哪一层

你需要懂很多模型原理,会调参,会做特征工程,能把一堆原始数据,通过复杂的工序,炼成一个能用的“丹”,也就是模型。他们的核心任务变了,变成了:如何用好这些现成的、强大的“布料”,去做出能解决自己业务问题、能赚钱的“衣服”(应用)。现在的“算法岗”,其实是个“岗位簇”现在大家嘴里说的“算法工程师”或者“AI工程师”,已经不是一个单一的岗位了,它其实分化成了好几个差异巨大的方向。你这个问题,我先给个结论,一个可能会让你有点意外但绝对是现实的结论:你遇到的情况,不是特例,而是正在迅速成为行业的主流和新常态。

2026-04-07 14:01:32 15

原创 大模型实习面试高频问题汇总

现在95%的大模型实习岗位,都不是让你去从头“创造”一个GPT-5,而是让你基于现有的模型,去做各种“下游”工作。大家想象中的大模型实习,可能是这样的:一排排A100/H100在你面前闪烁,你和团队大佬一起,对着满屏的代码和公式,高喊一声“开始训练!实际情况更可能是这样的:你的导师(mentor)丢给你一个开源模型(比如Llama 3, Qwen, ChatGLM),然后让你去解决一个具体的业务问题。不是教科书式的空谈,也不是夸张的“你只要努力就能进大厂”的励志文,而是尽量落地、可执行的路径。

2026-04-07 14:01:29 92

原创 大模型实习面试考察点全面解析

现在95%的大模型实习岗位,都不是让你去从头“创造”一个GPT-5,而是让你基于现有的模型,去做各种“下游”工作。大家想象中的大模型实习,可能是这样的:一排排A100/H100在你面前闪烁,你和团队大佬一起,对着满屏的代码和公式,高喊一声“开始训练!实际情况更可能是这样的:你的导师(mentor)丢给你一个开源模型(比如Llama 3, Qwen, ChatGLM),然后让你去解决一个具体的业务问题。不是教科书式的空谈,也不是夸张的“你只要努力就能进大厂”的励志文,而是尽量落地、可执行的路径。

2026-04-07 14:01:27 97

原创 大模型实习面试核心:ReAct范式与Agent思考-行动-观察循环

这样更可靠、更容易解析。语料切分:项目中的关系抽取任务是句子级关系抽取,传统的句子级关系抽取数据集每条样本的句子长度是几十个Token。我在项目中使用的自建数据集,质量一般,实体关系密度较低,如果按照传统句子级关系抽取的窗口来切分语料,会导致关系样本量不足。计算方法:首先利用 Embedding 模型(如 BGE 或 OpenAI-text-embedding)对某个关系类别下的所有样本句子进行向量化,然后对这些高维向量求均值(Mean Pooling),得到该类别的“质心向量”来代表这个关系的原型。

2026-04-07 14:01:24 77

原创 大模型实习需要什么技能?看这篇就够了

现在95%的大模型实习岗位,都不是让你去从头“创造”一个GPT-5,而是让你基于现有的模型,去做各种“下游”工作。大家想象中的大模型实习,可能是这样的:一排排A100/H100在你面前闪烁,你和团队大佬一起,对着满屏的代码和公式,高喊一声“开始训练!实际情况更可能是这样的:你的导师(mentor)丢给你一个开源模型(比如Llama 3, Qwen, ChatGLM),然后让你去解决一个具体的业务问题。不是教科书式的空谈,也不是夸张的“你只要努力就能进大厂”的励志文,而是尽量落地、可执行的路径。

2026-04-07 14:01:22 171

原创 大模型实习避坑:小厂研究院vs互联网中厂真实体验

体验是技术含量很高进步很大,虽然业务核心代码没啥注释,但用的都是比较先进的工程框架,靠着GPT老师一个个接口学,硬啃学会了分布式训练框架、推理框架,各种类型的微调……选择了小厂继续做rag,不过这边有agent开发内容,学会了langchain那些框架,有一说一感觉没啥用,自己也能写,纯应用层包装,门槛特低。小公司or普通研究院,非常一般。海面了好几家公司,靠以前的课题项目和pku一个研究院切合,拿了大模型算法实习生offer,实际上以rag+清洗数据为主,在这边学会的东西也不多,就是rag。

2026-04-07 14:01:19 182

原创 大模型实习选择:边缘大厂应用层vs中厂核心算法岗

体验是技术含量很高进步很大,虽然业务核心代码没啥注释,但用的都是比较先进的工程框架,靠着GPT老师一个个接口学,硬啃学会了分布式训练框架、推理框架,各种类型的微调……选择了小厂继续做rag,不过这边有agent开发内容,学会了langchain那些框架,有一说一感觉没啥用,自己也能写,纯应用层包装,门槛特低。小公司or普通研究院,非常一般。海面了好几家公司,靠以前的课题项目和pku一个研究院切合,拿了大模型算法实习生offer,实际上以rag+清洗数据为主,在这边学会的东西也不多,就是rag。

2026-04-07 14:01:17 151

原创 大模型实习要求高吗?真实JD分析

现在95%的大模型实习岗位,都不是让你去从头“创造”一个GPT-5,而是让你基于现有的模型,去做各种“下游”工作。大家想象中的大模型实习,可能是这样的:一排排A100/H100在你面前闪烁,你和团队大佬一起,对着满屏的代码和公式,高喊一声“开始训练!实际情况更可能是这样的:你的导师(mentor)丢给你一个开源模型(比如Llama 3, Qwen, ChatGLM),然后让你去解决一个具体的业务问题。不是教科书式的空谈,也不是夸张的“你只要努力就能进大厂”的励志文,而是尽量落地、可执行的路径。

2026-04-07 14:01:14 314

原创 大模型实习经验分享:从只会PyTorch到分布式训练框架

体验是技术含量很高进步很大,虽然业务核心代码没啥注释,但用的都是比较先进的工程框架,靠着GPT老师一个个接口学,硬啃学会了分布式训练框架、推理框架,各种类型的微调……选择了小厂继续做rag,不过这边有agent开发内容,学会了langchain那些框架,有一说一感觉没啥用,自己也能写,纯应用层包装,门槛特低。小公司or普通研究院,非常一般。海面了好几家公司,靠以前的课题项目和pku一个研究院切合,拿了大模型算法实习生offer,实际上以rag+清洗数据为主,在这边学会的东西也不多,就是rag。

2026-04-07 14:01:11 235

原创 大模型实习经历:互联网中厂vs小厂技术含量对比

3.后来读研一年多,潜修内功,学了vLLM,peft之类的训练框架,做了几个横向课题,对简单业务熟练了。选择了小厂继续做rag,不过这边有agent开发内容,学会了langchain那些框架,有一说一感觉没啥用,自己也能写,纯应用层包装,门槛特低。总结:互联网中厂大厂,尤其是给你权限给你机器玩的,去,提升极大。小公司or普通研究院,非常一般。海面了好几家公司,靠以前的课题项目和pku一个研究院切合,拿了大模型算法实习生offer,实际上以rag+清洗数据为主,在这边学会的东西也不多,就是rag。

2026-04-07 14:01:08 324

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除