AI大模型
文章平均质量分 62
AI大模型
工欲善其事&必先利其器
不懂AI的人,终会被AI时代所淘汰!!!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
模型推理阶段的一些问题总结
硬盘→显存:预加载阶段,速度慢(GB/s级),一次性完成显存↔GPU:运行阶段,速度极快(100GB/s~TB/s级),持续进行显存带宽指的是第2个阶段——模型已经在显存里"待命"后,GPU以多快的速度从中取数据进行计算。这也是为啥AI推理卡(如A100/H100)要配备HBM高带宽显存,因为生成每个token都需要把几百GB的参数过一遍显存总线。想象一个图书馆:模型权重 = 书架上的百科全书(永久摆在显存图书馆里,不会每次有人来查就重新搬进来)每个问题 = 读者来查不同的词条。原创 2026-05-29 17:48:19 · 378 阅读 · 0 评论 -
AI应用联网工具---SearXNG的使用总结
SearXNG的安装及使用原创 2025-11-21 23:03:05 · 276 阅读 · 0 评论 -
mcp server配置及使用总结
mcp server的配置及使用总结原创 2025-12-21 21:00:22 · 1185 阅读 · 0 评论 -
使用spring-ai时遇到的一些问题
springAI中使用本地嵌入模型时出现的一些问题及解决方法原创 2025-10-14 14:36:09 · 635 阅读 · 0 评论 -
深度学习框架TensorFlow的简介
深度学习框架TensorFlow的简介原创 2025-09-25 14:41:58 · 416 阅读 · 0 评论 -
模型架构与框架的关系
模型架构与框架的关系原创 2025-09-25 11:21:59 · 257 阅读 · 0 评论 -
深度学习框架PyTorch的简介
深度学习框架PyTorch的简介原创 2025-09-25 10:26:18 · 570 阅读 · 0 评论 -
大语言模型本身有记忆功能吗?
大语言模型本身是否有记忆功能原创 2025-09-23 16:34:34 · 509 阅读 · 0 评论 -
RAG知识库构建
RAG知识库构建介绍原创 2025-09-23 15:17:15 · 1370 阅读 · 0 评论 -
提示词和用户的提问之间的关系?
提示词和用户的提问之间的关系原创 2025-09-16 16:10:33 · 156 阅读 · 0 评论 -
Spring AI、LangChain4j 、LangChain 三者之间的区别
Spring AI、LangChain4j 、LangChain 三者之间的区别原创 2025-09-15 10:16:04 · 1214 阅读 · 0 评论 -
bank of river 和 bank of china 中的bank含义不一样。现代主流大模型是如何对bank的词向量进行计算并存储的?
多义词的词向量生成时的疑问答疑原创 2025-09-12 10:30:16 · 939 阅读 · 0 评论 -
向量与张量的区别与关系
向量与张量的区别和关系原创 2025-09-11 09:38:46 · 315 阅读 · 0 评论 -
Transformer模型架构之位置编码
Transformer模型架构之位置编码原创 2025-09-09 17:30:39 · 838 阅读 · 0 评论 -
Word2Vec词嵌入技术和动态词嵌入技术
Word2Vec原创 2025-09-09 16:22:54 · 1151 阅读 · 0 评论 -
数学知识--行向量与矩阵相乘,和矩阵与行向量相乘的区别
AI大模型涉及到的数学知识原创 2025-09-08 16:56:06 · 313 阅读 · 0 评论 -
什么是MCP
什么是MCP,以及MCP与RAG的关系原创 2025-09-04 15:37:06 · 769 阅读 · 0 评论 -
嵌入式大模型和云端大模型(聊天对话大模型)的区别
嵌入式大模型和云端大模型的区别原创 2025-09-04 15:02:29 · 737 阅读 · 0 评论 -
文本转成的向量为啥叫嵌入向量?
文本转成的向量为啥叫嵌入向量的说明原创 2025-09-04 14:25:57 · 968 阅读 · 0 评论 -
对嵌入式模型中的“嵌入式“的理解
对嵌入式模型的中"嵌入式"的理解原创 2025-09-04 11:08:08 · 297 阅读 · 0 评论 -
目标函数和损失函数的区别?
目标函数和损失函数的区别原创 2025-08-25 10:13:31 · 574 阅读 · 0 评论 -
pycharm的matplotlib不显示动图问题的解决
pycharm的matplotlib不显示动图问题的解决原创 2025-08-24 10:51:39 · 532 阅读 · 0 评论 -
Numpy模块下的ndarray介绍
Numpy模块下的ndarry介绍原创 2025-08-22 14:20:03 · 654 阅读 · 0 评论 -
PyCharm无法debug调试Streamlit的问题
PyCharm无法debug调试Streamlit的问题原创 2025-08-11 19:45:45 · 193 阅读 · 0 评论 -
Pycharm上如何查看Chroma向量数据库
Pycharm上如何连接查看Chroma向量数据库原创 2025-07-29 16:56:17 · 473 阅读 · 0 评论 -
Chroma创建持久化客户端时,首次启动会下载onnx.tar.gz
Chroma创建持久化客户端时,首次启动下载onnx.tar.gz慢的解决问题原创 2025-07-29 16:34:38 · 7687 阅读 · 0 评论 -
解决访问HuggingFace上的开源模型不通的问题。
解决访问HuggingFace上的开源大模型不通的问题原创 2025-07-27 11:08:13 · 815 阅读 · 0 评论 -
python版本升级后,历史下载的安装包不兼容的问题。
python版本升级后,历史下载的安装包和python新版本不兼容引起的问题原创 2025-07-27 10:57:43 · 6128 阅读 · 0 评论 -
LangSmith的配置介绍
LangSmith的使用原创 2025-07-26 11:41:26 · 1030 阅读 · 0 评论 -
大模型都火了这么久了,AI是如何“理解”知识的,你知道吗?
关于AI大模型中embedding的讲解原创 2025-07-25 20:45:17 · 142 阅读 · 0 评论 -
langServe启动过程中问题总结
langserve原创 2025-07-20 14:08:27 · 693 阅读 · 0 评论 -
conda常用命令及问题解决
conda常用命令说明原创 2025-07-17 11:02:41 · 1419 阅读 · 0 评论 -
秒懂AI|Prompt是什么?好的Prompt又是什么?
prompt-提示词的讲解原创 2025-07-16 16:19:57 · 289 阅读 · 0 评论 -
openai-hk实现中转访问openAI官网
openai-hk的接入介绍原创 2025-07-16 14:07:20 · 794 阅读 · 0 评论 -
Hugging Face的使用
HuggingFace是一个高速发展的社区,包括Meta、Google、Microsoft、Amazon在内的超过5000家组织机构在为HuggingFace开源社区贡献代码、数据集和模型。刚开始大多数的模型和数据集是NLP方向的,但图像和语音的功能模型正在快速更新中。Hugging Face 是一个专注于人工智能(尤其是自然语言处理)的开源平台和社区,提供模型、数据集、工具集的共享与研发支持,可视为“AI 模型的 GitHub”。,该镜像站由国内开发者维护,支持模型、数据集的加速访问。原创 2025-07-10 17:32:53 · 700 阅读 · 0 评论
分享