自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(780)
  • 问答 (2)
  • 收藏
  • 关注

原创 暑假两个月学习AI产品经理详细路线,看这一篇就够了

以下是一个暑假期间学习AI产品经理的详细路线,分为八个周来进行:第1周:了解AI产品管理基础阅读材料:《人工智能:一种现代的方法》了解AI基础。《人人都是产品经理》了解产品管理基础。在线课程:Coursera上的“人工智能基础”课程。edX上的“产品管理基础”课程。实践:调研市场上现有的AI产品,分析其功能、用户群体和市场定位。第2周:深入学习AI技术在线课程:Udacity的“深度学习纳米学位”基础课程。

2024-07-19 09:57:24 1643

原创 AI大模型从零到专家:全面教程,一课掌握!

坚持到了这儿,恭喜你,表示你有做AI大模型工程师的潜力。其实我想说的上面的内容只是冰山一角,刚开始大家不需要多么精通了解这些内容。主要是不断练习,让自己跳出「舒适区」,进入「学习区」,但是又不进入「恐慌区」,不断给自己「喂招」。记住,学习是一个持续的过程。大模型技术日新月异,每天都有新的研究成果和技术突破。要保持对知识的渴望,不断学习最新的技术和算法。同时,实践是检验学习成果的最佳方式。通过实际项目实践,你将能够将理论知识转化为实际能力,不断提升自己的技术实力。最后,不要忘记与同行交流和学习。

2024-07-05 16:22:36 1506

原创 当我面完国内20家公司大模型岗位面试,他们叫我卷王

淘天集团的大模型研究将主要围绕两个场景展开:一是搜广推,二是逛逛的内容化。团队组建工作由淘天集团CEO戴珊、淘天集团CTO若海、阿里妈妈CTO郑波等人共同牵头。介绍链接。淘天集团的大模型研究将主要围绕两个场景展开:一是搜广推,二是逛逛的内容化。团队组建工作由淘天集团CEO戴珊、淘天集团CTO若海、阿里妈妈CTO郑波等人共同牵头。介绍链接。

2024-06-29 16:37:19 2099

原创 AI 赚钱的 26 种方法:视频变幻、文案撰写、虚拟直播

Stars:1.0kLicense:这个项目是一个 AI 副业赚钱资讯信息的大合集,主要围绕使用 AIGC 技术生成内容,并分享一些自己的认知。该项目收录了各种利用 AI 技术进行副业赚钱的思路和方法,包括视频变幻、图片创作、文案撰写等多个方面。

2024-06-21 16:25:45 1650

原创 想要转行ai大模型赛道?看完这篇少走三年弯路!非常详细收藏我这一篇就够了!

最近有朋友说,想转行ai赛道,做大模型之类的工作,不知道有哪些岗位。今天就来聊聊,AI大模型有哪些方向,新人怎么转行大模型赛道,让大家少走弯路,早日在AI领域如鱼得水!其实,在招聘网站上搜搜 “大模型”,看看那些招聘要求,就能大概了解大模型工程师都有哪些方向了。主要分为下面这四类:数据治理方向:大模型数据工程师,主要负责爬虫、数据清洗、ETL、Data Engine、Pipeline 这些工作。简单说,就是要把数据整理得妥妥当当,让模型能 “吃” 得好。

2025-02-12 18:13:02 352

原创 WPS中接入DeepSeek,保姆级教程!

接下来,我们要把宏添加到WPS的功能区:返回WPS主界面,点击“文件” → “选项” → “自定义功能区”。在功能区里创建一个新的组,命名为“DeepSeek”。在命令列表中找到刚才添加的宏,点击“添加”,然后右键重命名为“生成”。最后,点击“确定”保存设置。好了,WPS的开发工具已经配置完成,接下来就是享受它的强大功能了!

2025-02-12 18:11:00 536

原创 从入门到精通:DeepSeek隐藏功能全揭秘,99%用户不知道!

DeepSeek已经成为全球AI用户的“生产力神器”,但为什么有些人用得顺风顺水,而你却感觉它“不够智能”?现在deepseek的 API 申请网站打不开了。然后用 R1 太卡的话,为了更好的进行实战,可以用硅基流动。注册地址:https://cloud.siliconflow.cn/i/BPkG64IG注册👆 送 2000 万 tokens,能用好久好久。其实,问题出在你的!今天教你一个简单,让DeepSeek变身你的“职场军师”和“流量引擎”!

2025-02-12 09:54:44 243

原创 大模型面试宝典:超详细指南与答案汇总,背下来你就是大模型大师!一周收7个offer

LLM(Large Language Model,大型语言模型)是指基于大规模数据和参数量的语言模型。具体的架构可以有多种选择,以下是一种常见的大模型LLM的架构介绍:Transformer架构:大模型LLM常使用Transformer架构,它是一种基于自注意力机制的序列模型。Transformer架构由多个编码器层和解码器层组成,每个层都包含多头自注意力机制和前馈神经网络。这种架构可以捕捉长距离的依赖关系和语言结构,适用于处理大规模语言数据。

2025-02-12 09:50:56 728

原创 大模型算法岗工资真的都是4开头了吗?揭秘最新薪资趋势!

AI大模型应该是当前AI领域最火的方向了。近日看到有些工资爆料,比如下面硕士985,大模型算法工程师,base薪资45K,4万签字费:硕士不是985,但是211,并且还是转码的,毕业还延了一年。现在转码不容易,延毕还能拿到这个薪资,那是更属不易:211选择其他非计算机AI专业,毕业想找到4开头的薪资,现在是很难的。

2025-02-12 09:45:22 478

原创 从面试官视角看2024年:大模型算法工程师的就业挑战与机遇

本来只是想简单写写而已,结果却一不留神写了这么多废话,希望能够对你有所帮助。

2025-02-12 09:41:43 752

原创 从零开始:手把手教你将DeepSeek接入个人微信

最近DeepSeek爆火,不仅仅是因为它开源、便宜,更重要的是它的写作能力、编码能力、搜索能力都是非常强的,并且它是我国首个开源的AI!有人说:会使用DeepSeek就成功了一半!哈哈,这有点过了,但确实会大大的提高开发的效率,例如前面我就写了一篇文章,利用DeepSeek开发一个全栈小程序,还小赚一笔!今天继续给大家带来手把手的教学,将DeepSeek接入到个人微信!掌握了本文的方法, 你也可以在微信中骚气的使用DeepSeek,那么DeepSeek整合到个人微信里面,能带来什么优点和方便之处呢?

2025-02-12 09:35:40 523

原创 从零开始:学AI大模型需要多久?如何快速上手?

随着人工智能技术的迅猛发展,AI大模型成为了当前最热门的技术领域之一。很多人对AI大模型既充满好奇又感到陌生,特别是对于那些完全没有编程基础的人来说,从零开始学习AI大模型似乎是一项艰巨的任务。但实际上,只要有足够的决心和正确的方法,任何人都有可能成为AI大模型领域的专家。本文将探讨从零基础学习AI大模型需要多长时间,以及如何确保你能够真正学会。

2025-02-11 21:09:15 443

原创 什么是大模型?一图全面了解,附国内外知名大模型及240余家清单!

AI大模型是“大数据+大算力+强算法”结合的产物,是一种能够利用大数据和神经网络来模拟人类思维和创造力的人工智能算法。它利用海量的数据和深度学习技术来理解、生成和预测新内容,通常情况下有数百亿乃至数万亿个参数,可以在不同的领域和任务中表现出智能。

2025-02-11 21:06:55 511

原创 程序员如何转行大模型?五大热门岗位推荐,IT行业最后的风口就在大模型!错过就难有下次了!

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。

2025-02-11 09:54:23 1299

原创 清华出品!DeepSeek 保姆级使用教程,收藏!(附下载方法)

什么是DeepSeek?介绍DeepSeek的核心概念与目标、功能与应用场景解析,指导用户如何快速上手DeepSeek。2。

2025-02-11 09:50:24 461

原创 Seed校招博士亲述:为什么我选择了字节跳动的大模型团队

我是一个方向比较独特的博士,做的是音乐生成。今年年底四年顺利毕业,最后的选择是:接了字节 Seed 的 offer,在工业界继续进行研究。逛知乎的这个方向的同行们应该多少读过我在知乎写的鸟瞰 ISMIR 知乎专栏系列。个人主页 https://ldzhangyx.github.io/人工智能可以作曲吗?如何看待中央音乐学院首招音乐人工智能方向博士生?更广泛来说人工智能在音乐领域的应用与前景?虽然 AIGC 火起来的这两年,看上去音乐生成已经成为一片红海,但我入行的时候并不是这个样子的。

2025-02-11 09:47:50 644

原创 基于DeepSeek-R1实现本地/API知识库,并接入微信BOT

在上一篇《[本地部署 DeepSeek-R1及微信机器人接入教程]》中,我们一起实现了本地部署DeepSeek-R1并接入了微信机器人,让它能跟我们聊天,今天,我要跟大家分享个更有意思的玩法:如何给咱们的 AI 助手喂点干货,让它变身成一个真正懂行的专业顾问!接下来我会手把手带大家完成整个知识库搭建过程,包括环境配置、知识库部署、上传资料,还有一些细节调优的小技巧。最后我们再把这个"充满知识"的AI接入微信机器人,打造一个真正懂你、懂行业的智能小助手!

2025-02-11 09:45:04 703

原创 Win10 +Ollama +deepseek开放局域网访问API服务

关于安装ollama[大模型本地化管理工具Ollama]如果想要在局域网中共享 Ollama 服务,需要配置防火墙以开放对应的端口。Ollama 服务使用环境变量 OLLAMA_HOST 来指定监听的地址,默认情况下,它只监听 localhost,即只能本地访问。如果要让局域网内其他设备访问 Ollama 服务,需要将 OLLAMA_HOST 设为 0.0.0.0。另外将端口开放访问即可。一、设置环境变量在 Windows 中,可以通过以下步骤来设置环境变量 OLLAMA_HOST:退出ollama服务,

2025-02-11 09:42:20 881

原创 工业大模型市场图谱:53个通用、行业及场景大模型全面梳理

AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享!

2025-02-10 20:49:44 719

原创 Prompt工程指南:从入门到精通,手把手教你玩转AI大模型!

Prompt是一种基于人工智能(AI)指令的技术,通过明确而具体的指导语言模型的输出。在提示词工程中,Prompt的定义涵盖了任务、指令和角色三个主要元素,以确保模型生成符合用户需求的文本。Prompt明确而简洁地陈述了用户要求模型生成的内容。这包括在特定应用场景中,用户希望模型完成的任务或生成的文本类型。模型在生成文本时应遵循的指令是Prompt中的关键要素之一。这些指令具体规定了模型生成文本的方式,通过清晰的语言来引导模型以获得所需的输出。Prompt中还包括模型在生成文本时应扮演的角色。

2025-02-10 20:46:57 499

原创 转行大模型入门公开课推荐!【建议收藏】,清华大学出品,必是精品!

近两年大模型迅速发展迎来了绝对的风口,如今大模型已然成为了引领诸多行业变革的核心力量,吸引着无数人渴望踏入这个充满机遇的领域。本文推荐几门适合转行大模型的几门公开课,从基础理论到前沿技术,再到实际项目应用,全方位覆盖。

2025-02-10 11:53:28 567

原创 2个安装包1条命令搞定:DeepSeek-R1最佳本地部署+知识库+联网搜索

公众号上看了很多关于Deepseek部署的文章,要么讲的太复杂,要么就是操作不成功。其实甭管是免费也好还是解决服务器繁忙也罢。本质都是本地部署,本地部署本身就非常简单,只需要三步环境就可以搭建起来,剩下的就是配置。跟着下面的步骤操作真的是小白都能运行起来。

2025-02-10 11:48:04 640

原创 DeepSeek外还有全球屠榜的Qwen 2.5 Max,看下它和o3-mini 的 PK

最近大家的目光是不是都集中在Deepseek R1这款模型上,以至于连关于Deepseek R1的本地化部署都炒作得飞起。具全球权威AI评测平台Chatbot Arena发布最新榜单,阿里云Qwen2.5-Max以位列全球第七,超越DeepSeek-V3、Claude-3.5-Sonne等模型。更引人注目的是,它在专精领域的发展。连lmsys官方都在为Qwen2.5-Max打Call,其能力可见一斑。那是否和大家说的同样厉害呢?老规矩,上手测一下就知道了。

2025-02-10 11:44:40 770

原创 DeepSeek R1深度解析及算力影响几何|附36页PDF文件下载

本文提供完整版报告下载,请查看文后提示。

2025-02-10 11:41:30 294

原创 大佬开源LLM学习笔记,14天速成高手,GitHub狂揽700星!

特别是论文,完整看完可能会非常耗时,所以在阅读这些材料之前,先确定你心中的问题,并有针对性地寻找答案,可以避免在不相关的内容上浪费时间,即使这些内容可能很有价值,但可能与你的需求无关。学习是一个非常个性化的体验,要学什么是基于「你已知的」和「你想知道的」,对于每个人来说,这个问题的答案都是不同的,所以不要完全照搬学习路线图,可以选择其中感兴趣的部分。总的来说,这些问题的解决需要深入理解模型的工作原理,以及如何通过各种技术手段来优化,随着研究的深入,可以开发出更加强大和可靠的智能体,以支持各种语言处理任务。

2025-02-09 11:57:36 935

原创 目前我见到的全网硬件成本最低运行DeepSeek R1 671b满血版完整指南(翻译)

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

2025-02-09 11:53:10 1623

原创 2025 编程神器:Cursor接入Deepseek 最新版R1 模型,无需配置api,免费使用

Cursor 是一款基于 AI 技术的智能代码编辑器,专为开发者设计。它深度融合了类似 ChatGPT 的 AI 功能(如代码生成、自动补全、代码解释等),并继承了 VS Code 的高效操作体验。快速生成代码片段调试代码错误学习新编程语言自动化重复编码任务。

2025-02-09 11:51:39 1333

原创 DeepSeek本地部署,可视化、无延迟、畅快使用

你的DeepSeek又提示服务器繁忙了吗?很多朋友已经发现DeepSeek的API服务能力远远没有跟上它的爆火程度,回答问题的响应速度明显比豆包、Kimi、智谱等国产大模型慢,时不时还会崩掉~~无论是个人体验还是企业业务,都需要一个低延迟响应大模型服务。此外,如果有数据隐私、定制化(微调、RAG、多模态)等需求时,本地部署就更加必要了。

2025-02-09 11:50:05 795

原创 超全大模型常见面试题及答案,非常详细收藏我这一篇就够了!

注意力机制是一种模拟人类注意力分配过程的模型,它能够在处理大量信息时,选择性地关注对任务更重要的信息,忽略无关信息。在自然语言处理中,注意力机制常用于机器翻译、文本摘要、问答系统等任务中,帮助模型捕捉输入序列中的关键信息。在计算机视觉中,注意力机制也用于图像识别、目标检测等任务,使模型能够关注图像中的关键区域。

2025-02-08 19:11:57 696

原创 5个免费提示词生成工具,轻松解放你的双手!

• 提示词优化大师:https://chatglm.cn/main/gdetail/65b73c4179e9b94fd54f545a• Kimi 提示词专家:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0• Prompt 提示词生成专家:https://xinghuo.xfyun.cn/desk?

2025-02-08 19:08:09 799

原创 普通程序员转行AI大模型的详细攻略,全部写在这里了,想转行AI大模型的朋友们,让你们少走几年弯路,赶上这个行业风口!

随着人工智能(AI)技术的迅猛发展,尤其是大型预训练模型(如GPT-3、BERT等)在自然语言处理、计算机视觉等多个领域的突破性应用,越来越多的技术从业者渴望转型进入这一前沿领域。对于普通程序员而言,这不仅是一个巨大的机遇,也是一个挑战。本文将提供一份详细的指南,帮助您从一个普通的程序员顺利过渡到AI大模型的专业人士。

2025-02-08 10:07:51 731

原创 大模型(LLM)专家精通之路(含学习路线图、书籍、课程等免费资料推荐)

全参数微调会更新模型的所有参数,但这需要大量的计算资源。其中一些是已经较为成熟的技术(如模型合并、多模态)([MiniCPM-o 2.6:开源大型语言模型在多模态任务上超越GPT-4o和Claude 3.5]),而另一些则是更具实验性的(如可解释性、测试时计算扩展),并且是许多研究论文的重点。• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

2025-02-08 10:01:48 649

原创 DeepSeek指导手册一24张图让你从入门到入土

近期DeepSeek备受关注,其在技术、成本、权威背书、开源创新以及市场影响等多个方面均表现出色。大家也终于感受到了国产的人工智能,虽然现在经常服务器存在问题,但相信不久将来一定可以为我们使用,前天看到的一个DeepSeek手册,其实对于老玩家也没多大用,但对于新手还是可以简单一看,了解一下它的应用场景。原标题是“DeepSeek15天指导手册一从入门到精通”,存在夸大和吸引目光嫌疑,故改了下,就是24页图,大约10分钟,从入门到入土吧,先一览众山小,再慢慢感悟其中奥秘之处。

2025-02-08 09:58:20 430

原创 DeepSeek-R1推理能力迁移到千问Qwen,知识蒸馏全解析!

知识蒸馏是一种机器学习中的模型压缩技术,旨在将复杂的大型模型(称为教师模型,Teacher Model)的知识迁移到较小的模型(称为学生模型,Student Model)。这一方法特别适用于计算资源有限的设备(如手机或嵌入式设备),在显著降低模型规模的同时,尽量保留性能和精度。通过上述流程,知识蒸馏实现了“以大带小”的能力迁移。流程图清晰地展示了这一技术的关键步骤:教师模型生成预测,学生模型通过学习这些预测实现能力提升,最终部署到低资源设备上。

2025-02-08 09:54:11 1577

原创 一文读懂大模型:什么是大模型及其应用场景全解析,非常详细收藏我这一篇就够了!

大模型是指具有大规模参数和复杂计算结构的机器学习模型。这些模型通常由深度神经网络构建而成,拥有数十亿甚至数千亿个参数。大模型的设计目的是为了提高模型的表达能力和预测性能,能够处理更加复杂的任务和数据。大模型在各种领域都有广泛的应用,包括自然语言处理、计算机视觉、语音识别和推荐系统等。大模型通过训练海量数据来学习复杂的模式和特征,具有更强大的泛化能力,可以对未见过的数据做出准确的预测。

2025-02-07 19:28:00 1259

原创 LightRAG开源发布!轻巧、强大,GraphRAG的升级版!

现有的RAG系统老是搞不清复杂关系,答案经常被切碎,缺乏上下文,难以真正理解问题。而LightRAG就是来解决这些问题的,它把图结构引入文本索引和检索,采用,从低到高全面覆盖信息。更酷的是,它还能更新数据,保持实时高效的响应,而且它已经开源了哦!并且你现在可以通过简单的API调用来实现多种检索模式,包括本地、全局和混合检索。

2025-02-07 19:24:26 705

原创 大模型都有哪些方向?各方向的能力要求和岗位匹配?新手转行大模型常踩的坑和常见的误区?以及入行大模型最顺滑的路径?

最后,给准备入场大模型的新人几点建议:不要只关心 finetune,SFT,RLHF,作为系统性学习是 OK 的,切忌花太多精力。想做应用的,建议 focus 到某个垂直领域,比如对话机器人,问答系统,金融/医疗/教育方向,找一个具体的场景,把它做好,做深。多关心数据,data pipeline,高质量训练/测试集的构建经验,对数据的sense,是最直接,也是最适合用到未来工作当中的。大模型不只有算法,也可以有工程。

2025-02-07 09:30:15 729

原创 DeepSeek 服务器繁忙?这里有 100 个解决方案。。。

这两天你看到最多的话是哪句?是不是“服务器繁忙,请稍后再试”?😂反正不论是评论区还是后台私信,我看到最多的消息就是它了。我看了下 DeepSeek 的事件监控,5 号果然又出现性能异常事件。没想到开工第一天,DeepSeek R1 比打工人还忙。是不是很好奇为什么一直这么卡呢?我看了下 AI 产品榜今天统计的 DeepSeek 的日活跃用户数已经高达 2215万,约为 ChatGPT 日活跃用户的 41.6%,豆包的日活跃用户数为 1695 万。

2025-02-07 09:23:32 6349

原创 零代码基础,DeepSeek教你搭建微信小程序并赚取收益!

目标使用deepseek从0开始完成一次小程序的搭建,感受人工智能的力量打开deepseek输入目标:完成一次微信小程序的上线Deepseek给出了完整的流程步骤,现在我们按照步骤进行操作一、准备工作Step1:注册微信小程序,获取appidStep2:填写相关注册信息Step3:注册完成后,进入到小程序界面找到自己的applID二、安装开发者工具Step1:进入到开发者工具中,安装电脑对应的开发者工具安装完成后进行点开运行进入到小程序主体界面中Step2:创建项目。

2025-02-06 20:37:53 1731

原创 高阶玩法:Coze+DeepSeek打造一站式视频制作工作流(建议收藏)

最近在研究使用Coze工作流制作视频,虽然其官方支持的视频插件有限,但合理组合使用,也能覆盖不少我们的应用场景。比如下面这个账号,其主要分享认知思维的内容。以口播的方式直接阐述认知观点。搭配简洁的背景和深度的解读,总能吸引人停留关注。小红书主页案例:那是否可以利用Coze,实现一站式视频生成的工作流呢?试一下不就知道了?账号拆解我们可以直接将账号截图丢给DeepSeek-R1模型,让其先进行深度分析和拆解参考DeepSeek的分析结果,可以确定制作此类视频的关键信息,为后续工作流搭建理清思路。

2025-02-06 20:35:23 1037

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除