AI_小站
码龄1年
关注
提问 私信
  • 博客:485,155
    485,155
    总访问量
  • 428
    原创
  • 2,685
    排名
  • 5,683
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:湖南省
  • 加入CSDN时间: 2024-05-09
博客简介:

python1234567_的博客

查看详细资料
  • 原力等级
    当前等级
    7
    当前总分
    2,845
    当月
    267
个人成就
  • 获得9,039次点赞
  • 内容获得5次评论
  • 获得7,613次收藏
  • 代码片获得1,924次分享
创作历程
  • 32篇
    2025年
  • 400篇
    2024年
成就勋章
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

看完还不懂什么是Transformer及其注意力机制我直接吃!

Transformer与注意力机制已经彻底改变了深度学习领域,为处理序列数据并捕捉长距离依赖关系提供了一种强大的方式。在本文中,我们将深入探讨Transformer的基本原理,以及注意力机制在提升模型性能和连贯性方面的重要性。在深度学习领域,注意力机制的出现堪称革命性,它使模型能够动态地关注输入数据的相关部分,类似于人类关注视觉场景或对话中的某些方面。这种选择性关注在上下文至关重要的任务(如语言理解或图像识别)中尤为重要。
原创
发布博客 2025.01.23 ·
1223 阅读 ·
50 点赞 ·
0 评论 ·
16 收藏

MacBook 本地化部署 Dify 指南

今天带来的是AIAgent 的另外一个流派,可以支持本地化部署的开源 AIAgent 平台Dify。Dify 是一个开源的 LLMOps(大语言模型运营)平台,它允许开发者能够在本地快速创建和部署 AI 应用。Dify 和 Coze 类似,也是通过可视化的方式进行 AI 应用构建,而且支持多种大语言模型,包含 GPT-3.5 、 GPT-4 等,同时,Dify 的另外一大优势是能接入本地化部署的大语言模型。在应用提供上,Dify 还提供了API 接口,可以让用户非常方便的将 AI 应用集成到其他系统。
原创
发布博客 2025.01.23 ·
559 阅读 ·
18 点赞 ·
0 评论 ·
30 收藏

大模型好书安利:《大模型时代:ChatGPT开启通用人工智能浪潮》(附学习PDF)

任何一个单一的大模型统治世界都是极其可怕的前景,只有每个鲜活的个人都拥有自己的个性化的大模型时,新知识才会爆炸性地产生,这个世界才会变得更加可爱。书中还对大语言模型全面融入商务管理、知识生产和创意娱乐等诸多人类实践领域进行了探索和展望,指出人工智能相关技术的迅猛发展将帮助人们全方位地认识世界、融入世界、改变世界,实现人的价值,为人类描绘全面智能化时代的未来图景。生成式大模型正在开创新的时代,基于生成式预训练大模型的技术突破,也在带来面向个人、深入行业的多重应用。但在同时,与机会如影随形的泡沫也会随之涌现。
原创
发布博客 2025.01.22 ·
930 阅读 ·
25 点赞 ·
0 评论 ·
15 收藏

RAG+Prompt,AI编程从需求到代码

在软件开发过程中,准确理解和拆解业务需求是至关重要的。这要求开发人员不仅具备技术专长,还需要对业务领域有深入的理解。然而,面对复杂多变的业务需求,仅凭人工往往难以做到高效且准确的拆解。为此,腾讯云 AI 代码助手引入了检索增强型生成模型(RAG)与大型语言模型(LLM)的结合,旨在通过智能辅助提升业务需求的理解与拆解效率。本文将深入探讨这一创新方案,展示其在实际软件开发中的应用效果。在理解业务需求时,RAG 知识库会首先检索相关的历史案例、文档和领域知识,然后基于这些信息进行生成。
原创
发布博客 2025.01.22 ·
951 阅读 ·
28 点赞 ·
0 评论 ·
23 收藏

新手教程,使用Langchain-Chatchat构建自己的专属GPT

langchain 这个框架包括衍生出来的 Langchain-Chatchat 还是很值得大家关注的,对于有私有数据,不方便上传到 gpt 的,可以自己搭建这种功能的服务。另外,langchain 这个框架的发展速度是想当惊人的,现在已经有 83k 的 start,也就是 8 万 3 千多人,项目贡献者已经超多了 2600 人,是值得大家关注学习的。
原创
发布博客 2025.01.21 ·
1040 阅读 ·
12 点赞 ·
0 评论 ·
13 收藏

大模型瓶颈之——大模型长文本处理问题以及解决方案

正如大家所知道的那样,大模型上下文窗口是有限制的,而上下文窗口大小是大模型的评价标准之一,越强大的大模型越有着更长的上下文窗口。而传说谷歌推出的Gemini 1.5 Pro模型将上下文长度刷新到了100万token,创下了最长上下文窗口的记录。那么大模型窗口上下文长度有哪些难点和问题,以及都是怎么解决的?01大模型长文本处理问题在现有的大模型体系中,上下文窗口是一个很重要的评判标准,越长的上下文窗口意味着越强的性能;但同时,当上下文长度超过一定界限之后,大模型的性能会呈现断崖式下降。
原创
发布博客 2025.01.21 ·
1128 阅读 ·
26 点赞 ·
0 评论 ·
18 收藏

大模型干货必看:大语言模型(LLM)如何更好地继续预训练(Continue PreTraining)

预训练(Pretraining)是一个非常消耗资源的工作,尤其在LLM时代。随着LLama2的开源,越来越多人都开始尝试在这个强大的英文基座模型上进行中文增强。但,我们如何才能保证模型在既学到「中文知识」的情况下,又不丢掉原有的「英文知识」呢?今天给大家带来一篇ContinuePretraining的论文(来自何枝大佬,知乎@何枝),ContinualPre-TrainingofLargeLanguageModels:Howto(re)warmyourmodel?
原创
发布博客 2025.01.20 ·
369 阅读 ·
4 点赞 ·
0 评论 ·
3 收藏

细思极恐,为什么大多产品经理很水?

还没入行时,一提起产品经理这个岗位,你会想到什么?●跟“经理”沾边,一毕业就是经理,说不定还能做管理,好高大上!●跟朋友聊天时,一提到自己是产品经理,吹牛都有了素材,朋友纷纷羡慕不已!……当你进一步走近产品经理时,看到网上对它的评价:看完后,你会认为产品经理果然符合你的认知,它在公司中地位很高,甚至还可能是公司的核心领导层。于是,当你继续浏览“产品经理”的其他信息时,看到了不少类似“产品经理是小CEO”的言论,更为心动。一份产品经理的工作,却是公司CEO的角色,既拥有创造性,又会带来成就感,上可对接
原创
发布博客 2025.01.20 ·
949 阅读 ·
23 点赞 ·
0 评论 ·
13 收藏

这本大模型书是真的牛啊!150页就能让你上手大模型应用开发,简单又透彻

仅仅发布 5 天,ChatGPT 就吸引了 100 万用户——当然,数据不是关键,关键是其背后的技术开启了新的 AI 狂潮,成为技术变革的点火器。书如其名,这是一本有关大模型应用开发的极简入门手册,为初学者提供了一份清晰、全面的“最小可用知识”,带领大家快速了解 GPT-4 和 ChatGPT 的工作原理及优势,并在此基础上使用流行的 Python 编程语言构建大模型应用。何文斯(译者),大模型创业公司 Dify 产品经理、自媒体“何文斯”作者,致力于研究大模型中间件技术和AI应用工程化的实际落地。
原创
发布博客 2025.01.18 ·
431 阅读 ·
8 点赞 ·
0 评论 ·
4 收藏

漫画 Transformer: 手把手用数学公式推导

用于创建 ChatGPT 的数据集为 570 GB。
原创
发布博客 2025.01.18 ·
1001 阅读 ·
29 点赞 ·
0 评论 ·
16 收藏

AI产品经理是如何炼成的?青铜逆袭必修课

AI发展至今大致按照在产业结构上的分工不同产生了三种类型的公司,我们在转型时最好要先明确自己的优势及兴趣,来判断自己适合着眼于哪个层面的工作,从而进行针对性的学习和提升。(1)行业+AI这类公司重在“行业”,本身有着一定的行业积累,给用户提供AI赋能后的产品或服务。例如:智能家居、智能车载等。这类公司对产品经理的要求重点在对行业的理解上,以及需要对行业趋势有一定的insight。目前此类公司的战略趋势是会越来越细分到具体的垂直场景上,所以这也对产品经理的场景分析能力有较高要求。(2)AI+行业这类公司重在“
原创
发布博客 2025.01.17 ·
938 阅读 ·
13 点赞 ·
0 评论 ·
22 收藏

部署基于 LLM 的私有知识库系统 AnythingLLM

AnythingLLM是一个全栈应用程序,您可以使用现成的商业大语言模型或流行的开源大语言模型,再结合向量数据库解决方案构建一个私有ChatGPT,不再受制于人:您可以本地运行,也可以远程托管,并能够与您提供的任何文档智能聊天。AnythingLLM将您的文档划分为称为workspaces (工作区)的对象。工作区的功能类似于线程,同时增加了文档的容器化,。工作区可以共享文档,但工作区之间的内容不会互相干扰或污染,因此您可以保持每个工作区的上下文清晰。
原创
发布博客 2025.01.17 ·
785 阅读 ·
19 点赞 ·
0 评论 ·
27 收藏

今年读过最惊艳一本书!几乎把ChatGPT讲透了——<ChatGPT 从⼊⻔到精通>

ChatGPT 作为⼀种强⼤的⾃然语⾔处理模型,其应⽤前景⼴泛,可以应⽤于⾃然语⾔⽣成、对话系统、推荐系统、知识图谱构建、智能家居、⼈⼯智能教育、语⾳识别、机器⼈等多个领域。和重要的AI大模型资料包括市面上AI大模型各大白皮书、AGI大模型系统学习路线、AI大模型视频教程、实战学习,等录播视频免费分享出来,需要的小伙伴可以扫取。和重要的AI大模型资料包括市面上AI大模型各大白皮书、AGI大模型系统学习路线、AI大模型视频教程、实战学习,等录播视频免费分享出来,需要的小伙伴可以扫取。
原创
发布博客 2025.01.16 ·
477 阅读 ·
16 点赞 ·
0 评论 ·
0 收藏

把LangChain跑起来的3个方法

使用 LangChain 开发 LLM 应用时,需要机器进行 GLM 部署,好多同学第一步就被劝退了,那么如何绕过这个步骤先学习 LLM 模型的应用,对 Langchain 进行快速上手?本片讲解 3 个把 LangChain 跑起来的方法,如有错误欢迎纠正。Langchain 官方文档地址:https://python.langchain.com/
原创
发布博客 2025.01.16 ·
688 阅读 ·
15 点赞 ·
0 评论 ·
17 收藏

大模型神书《HuggingFace自然语言处理详解——基于BERT中文模型的任务实战》读完少走几年弯路!

2.1 编码工具简介 62.2 编码工具工作流示意 62.3 使用编码工具 82.4 小结 15。
原创
发布博客 2025.01.15 ·
688 阅读 ·
24 点赞 ·
0 评论 ·
17 收藏

大模型微调训练实战|Qwen2.5思维链微调代码实操 + 多卡Lora微调完整代码

思维链技术(Chain of Thought,也简称为CoT),最早由Json Wei等人在《Chain-of-Thought Prompting Elicits Reasoning in Large Language Models》[2]文章提出。简单来说就是通过提示词让模型能够将一个复杂的问题分步思考。比如举个文章中提到的例子(见下图),一个数学问题是:食堂有 23 个苹果。如果他们用掉了 20 个来做午餐,又买了 6 个,现在他们有多少个苹果?
原创
发布博客 2025.01.15 ·
672 阅读 ·
12 点赞 ·
0 评论 ·
17 收藏

AI大模型入门书籍分享(附PDF)大模型时代:ChatGPT开启通用人工智能浪潮

讲述ChatGPT大模型的前世今生和台前幕后。
原创
发布博客 2025.01.14 ·
583 阅读 ·
11 点赞 ·
0 评论 ·
14 收藏

Spring AI 基于ollama:qwen:7b + pgvector 实现RAG问答系统

了解完嵌入模型、向量数据库相关知识后,在此基础上可以实现一个RAG本地问答系统。
原创
发布博客 2025.01.14 ·
980 阅读 ·
27 点赞 ·
0 评论 ·
28 收藏

ai产品经理必备《AI赋能:AI重新定义产品经理》,一直在定义,从未被超越

大家好,今天给大家推荐一本ai产品经理必读的一本书籍《AI赋能:AI重新定义产品经理》,非常适合转行/入门或者已经是产品经理的小伙伴们。随着AI在越来越多的行业被应用,AI赋能的价值逐步体现出来。本书从AI的本质出发,介绍AI技术过往的发展历程和最新的理论成果,然后讲解如何站在移动互联网和大数据的基础上,系统地学习、应用AI技术。本书旨在向读者提供学习AI技术的资料、路径,以及打磨AI产品的观点、思路。此外,本书通过介绍笔者接触、打磨AI产品的实际经历,指出AI赋能过程中需要避免的“坑”。
原创
发布博客 2025.01.13 ·
528 阅读 ·
9 点赞 ·
0 评论 ·
5 收藏

AI扣子案例解析(附coze提示词):无需一行代码轻松用工作流循环节点,一次生成365天的黄历系列海报

循环黄历系列海报最近有同学催更,扣子工作流中的循环节点,今天就给大家安排一波;不用代码怎么将文本内容转为数组,再用循环节点重复执行一系列任务。今日案例:将用户指定的时间段内的每个日期进行拆解,每个日期分别生成一张图片;----黄历系列海报(附完整流程和提示词)测试运行结果:2024年第二季度第二周:通过设定循环次数和逻辑,重复执行一系列任务,直到满足某个条件为止。:循环类型是循环节点的运行模式,支持设置为使用数组循环、指定循环次数和无限循环。数组是计算机编程中的一种数据结构,用于存储一系列元素。
原创
发布博客 2025.01.13 ·
949 阅读 ·
9 点赞 ·
0 评论 ·
25 收藏
加载更多