kuokay
码龄6年
求更新 关注
提问 私信
  • 博客:860,159
    社区:591
    问答:53
    动态:1,072
    861,875
    总访问量
  • 187
    原创
  • 94,480
    粉丝
  • 6
    关注
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:北京市
加入CSDN时间: 2019-05-14
博客简介:

kuokay的博客

查看详细资料
个人成就
  • 前沿技术领域优质创作者
  • 博客专家认证
  • 获得1,166次点赞
  • 内容获得266次评论
  • 获得6,997次收藏
  • 代码片获得10,863次分享
  • 原力等级
    原力等级
    9
    原力分
    7,036
    本月获得
    98
创作历程
  • 12篇
    2025年
  • 17篇
    2023年
  • 51篇
    2022年
  • 91篇
    2021年
  • 17篇
    2020年
成就勋章
TA的专栏
  • 安全
    10篇
  • 大数据
    5篇
  • 机器人ROS
    2篇
  • 人工智能
    26篇
  • 前端
    6篇
  • python
    47篇
  • GO语言
    35篇
  • 运维
    15篇
  • 笔记
    7篇
  • 游戏开发
    4篇
  • 数据库
    5篇
  • 设计模式
    1篇
  • 网站
    1篇
  • docker
    4篇
  • 测试
    1篇
  • c++
    2篇
  • GIT
    1篇
  • Linux
    1篇
  • MQ
    3篇

TA关注的专栏 0

TA关注的收藏夹 0

TA关注的社区 10

TA参与的活动 1

兴趣领域 设置
  • Python
    python
  • 开发工具
    vscode
  • 前端
    vue.js
  • 后端
    golang
  • 云原生
    容器
  • 人工智能
    opencv计算机视觉深度学习图像处理
  • 游戏
    cocos2d
创作活动更多

新星杯·14天创作挑战营·第9期

这是一个以写作博客为目的的创作活动,旨在鼓励大学生博主们挖掘自己的创作潜能,展现自己的写作才华。如果你是一位热爱写作的、想要展现自己创作才华的小伙伴,那么,快来参加吧!我们一起发掘写作的魅力,书写出属于我们的故事。我们诚挚邀请你们参加为期14天的创作挑战赛! 注: 1、参赛者可以进入活动群进行交流、分享创作心得,互相鼓励与支持(开卷),答疑及活动群请见 https://bbs.csdn.net/topics/619626357 2、文章质量分查询:https://www.csdn.net/qc

475人参与 去参加
  • 最近
  • 文章
  • 专栏
  • 代码仓
  • 资源
  • 收藏
  • 关注/订阅/互动
更多
  • 最近

  • 文章

  • 专栏

  • 代码仓

  • 资源

  • 收藏

  • 关注/订阅/互动

  • 社区

  • 帖子

  • 问答

  • 课程

  • 视频

搜索 取消

大模型里常说的AI智能体(Agent)是什么?

AI 智能体(Agent)是一个能够自主感知环境、制定目标、规划行动并执行任务的智能系统。它不仅仅是一个被动响应指令的模型,而是具备主动性和决策能力的实体,能够像人类一样与环境交互,完成复杂任务。自主性: AI Agent能够自主决策和执行任务,无需人类干预。适应性: 能够根据环境变化调整自己的行为。交互性: 能够与人类或其他AI Agent进行交流与合作。学习能力: 通过学习不断优化自己的行为和决策。
原创
发布博客 前天 06:30 ·
606 阅读 ·
9 点赞 ·
0 评论 ·
19 收藏

一文搞懂大模型 - RAG(检索、增强、生成)

RAG(检索-增强-生成,Retrieval-Augmented Generation)是一种结合了信息检索与文本生成的技术框架,旨在通过动态引入外部知识提升生成模型的效果。
原创
发布博客 2025.03.22 ·
774 阅读 ·
9 点赞 ·
0 评论 ·
30 收藏

大模型里面常说的Embedding(嵌入)是什么

Embedding(嵌入)是机器学习和自然语言处理(NLP)中的一种关键技术,其核心思想是将高维、离散、非结构化的数据(如文字、图像、用户行为等)转换为低维、连续、稠密的向量表示。这些向量不仅能被计算机高效处理,还能捕捉数据之间的潜在关系(如语义、相似性等)。例如:文字:单词“猫” → 向量 [0.3, -0.8, 1.2, …, 0.5]图像:一张猫的图片 → 向量 [0.7, 0.1, -0.3, …, 0.9]用户行为:用户点击商品A → 向量 [0.4, -0.2, 0.6, …, 0.1]
原创
发布博客 2025.03.19 ·
2096 阅读 ·
44 点赞 ·
0 评论 ·
37 收藏

向量数据库原理及选型

向量数据库(Vector database)、向量存储或向量搜索引擎是一种能够存储向量(固定长度的数值列表)及其他数据项的数据库。向量数据库通常实现一种或多种近似最近邻(Approximate Nearest Neighbor,ANN)算法,使用户可以使用查询向量搜索数据库,以检索最匹配的数据库记录。通俗的来说,例如你想喝一杯“类似摩卡(向量[12,13,19,8,9])但苦味更少”的咖啡:传统菜单:只能按名称选(“摩卡在A10单元格”)。
原创
发布博客 2025.03.16 ·
693 阅读 ·
11 点赞 ·
0 评论 ·
13 收藏

一文带你入门 MCP(模型上下文协议)

Model Context Protocol (MCP) 是一个开放协议,它使 LLM 应用与外部数据源和工具之间的无缝集成成为可能。无论你是构建 AI 驱动的 IDE、改善 chat 交互,还是构建自定义的 AI 工作流,MCP 提供了一种标准化的方式,将 LLM 与它们所需的上下文连接起来。目前,MCP 已经积累了足够的临界规模和动能,因此它被视为 2023-2025 年“代理开放标准”之争的潜在赢家。
原创
发布博客 2025.03.16 ·
1896 阅读 ·
14 点赞 ·
0 评论 ·
31 收藏

AI虚拟女友/角色扮演/AI聊天伴侣开源项目汇总

各位开发者小伙伴们,今天给大家解锁一波超实用的AI黑科技!近期GitHub上涌现了大量开源的AI虚拟伴侣项目,从高情商对话模型到角色扮演系统,从情感陪聊助手到个性化女友定制工具,这些项目不仅支持本地一键部署,更可以让开发者自由改造。目前的项目已有多个支持:✅ 个性化角色设定✅ 跨平台API对接✅ 对话记忆增强✅ 情感响应优化技术改变生活,这些开源方案不仅适合个人开发者练手,更为情感计算研究提供了宝贵资源库。文章已整理好精选项目清单,期待看到大家创造出更有趣的AI交互应用!
原创
发布博客 2025.03.14 ·
896 阅读 ·
24 点赞 ·
0 评论 ·
8 收藏

最全DeepSeek关键RL算法GRPO,手把手教你从头跑通

GRPO(Group Relative Policy Optimization)是 DeepSeek-R1 成功的基础技术之一。简单来说,GRPO 算法丢弃了 critic model,放弃了价值函数近似,转而通过组内样本的相对比较来计算策略梯度,从而有效降低了训练的不稳定性,同时提高了学习效率。既然 GRPO 如此有效,那么,你知道如何从头开始实现 GRPO 吗?
原创
发布博客 2025.03.12 ·
952 阅读 ·
23 点赞 ·
0 评论 ·
29 收藏

DeepSeek核心强化学习算法:GRPO介绍

GRPO 是一种在线学习算法,这意味着它通过使用训练模型本身在训练期间生成的数据进行迭代改进。GRPO 目标背后的直觉是最大限度地利用生成的完成,同时确保模型始终接近参考策略。GRPO 的发明者是 DeepSeek,最早是被用于微调 DeepSeek 的 R1 和 R1-Zero 模型 —— 它们可通过学习生成思维链(CoT)来更好地解决数学和逻辑问题。
原创
发布博客 2025.03.12 ·
737 阅读 ·
8 点赞 ·
0 评论 ·
8 收藏

LangChain详细体验

LangChain是一个强大的框架,旨在帮助开发人员使用语言模型构建端到端的应用程序。它提供了一套工具、组件和接口,可简化创建由大型语言模型 (LLM) 和聊天模型提供支持的应用程序的过程。LangChain 可以轻松管理与语言模型的交互,将多个组件链接在一起,并集成额外的资源,例如 API 和数据库。这个框架由几个部分组成。langchain-core:基本抽象和 LangChain 表达式语言。langchain-community:第三方集成。
原创
发布博客 2025.03.10 ·
651 阅读 ·
25 点赞 ·
0 评论 ·
8 收藏

Sapiens人类行为AI模型

Sapiens是Meta公司推出的一个专注于与人类相关的任务的模型。Meta Sapiens模型旨在理解和模拟人类行为,包括理解身体姿势、识别身体部位、预测深度,甚至确定皮肤纹理等表面细节。Sapiens 为以人为中心的视觉任务(例如 2D 姿势、零件分割、深度、法线等)提供了一套全面的套件。该模型系列在 3 亿张野外人类图像上进行了预训练,并显示出对不受约束条件的出色泛化。这些模型还设计用于提取高分辨率特征,以 1024 x 1024 图像分辨率和 16 像素的补丁大小进行本机训练。
原创
发布博客 2025.03.07 ·
933 阅读 ·
20 点赞 ·
0 评论 ·
26 收藏

Unsloth 基于自己的数据集微调建立专属模型

unsloth 是开源的大语言模型(LLM)微调工具,基于优化计算步骤和 GPU 内核,显著提升模型训练速度减少内存使用。Unsloth支持多种主流 LLM,如 Lama-3、Mistral、Phi-4等,在单 GPU 上实现最高 10倍、多 GPU 上最高 32 倍的加速效果,同时内存使用减少 70% 以上。unsloth 提供免费的开源版本,用户能在 Google Colab 或 Kaggle Notebooks 上快速体验。
原创
发布博客 2025.03.05 ·
1102 阅读 ·
25 点赞 ·
0 评论 ·
30 收藏

最详细的谷歌Colab白嫖·部署Deepseek

DeepSeek是这段时间最热门的话题之一,其蒸馏模型可以实现低成本而高质量的推理,使得我们现在可以在本地小型化的硬件上也用上大模型这一AI利器。本文主要介绍通过Colab来部署DeepSeek R1模型的方法。使用Ngrok穿透让本地Chatbox可以调用ollama Deepseek api。
原创
发布博客 2025.03.03 ·
747 阅读 ·
26 点赞 ·
0 评论 ·
16 收藏

python和go相互调用的两种方法

将go代码编译成so库 -> python中通过ctypes引用so库并指定需要调用的函数(同时可指定传入参数类型和返回值类型) -> 指定后按python使用函数方式调用。需要注意的是:python和go之间参数传递是需要经过C的数据类型转换的,因此需要了解python中ctypes数据类型和python数据类型以及C的数据类型对应关系ctypes数据类型为指定调用函数时的传入参数和返回值的数据类型python数据类型为调用函数时传入的参数的数据类型。
原创
发布博客 2023.10.06 ·
4664 阅读 ·
5 点赞 ·
2 评论 ·
9 收藏

Kerberos 身份验证

Kerberos 是一种由 MIT(麻省理工大学)提出的一种基于加密 Ticket 的身份认证协议。它旨在通过使用密钥加密技术为客户端/服务器应用程序提供强身份验证,用于验证用户或主机的标识。。适用范围:Windows Server 2022、Windows Server 2019、Windows Server 2016在 Kerberos 协议中主要是有三个角色的存在:1、访问服务的 Client;2、提供服务的 Server;
原创
发布博客 2023.09.11 ·
798 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

本地部署 langchain-ChatGLM

大型语言模型(LLM)正在成为一种变革性的技术,使开发者能够建立他们以前无法建立的应用程序。然而,孤立地使用这些LLM往往不足以创建一个真正强大的应用程序–当你能将它们与其他计算或知识来源相结合时,真正的力量才会出现。这个库的目的是协助开发这些类型的应用。langchain 使用 Transformer 模型,并在多个语言间建立链式结构实现翻译。比如,它可以通过英语→法语→西班牙语完成英语到西班牙语的翻译。langchain 只使用公开数据集进行训练,不需要额外的数据。WMT2014英法翻译数据集。
原创
发布博客 2023.06.05 ·
4371 阅读 ·
1 点赞 ·
2 评论 ·
13 收藏

FastChat(小羊驼模型)部署体验

前段时间,斯坦福发布了Alpaca,是由Meta的LLaMA 7B微调而来,仅用了52k数据,性能可以与GPT-3.5匹敌。FastChat集成了Vicuna、Koala、alpaca、llama等开源模型,其中Vicuna号称能够达到gpt-4的90%的质量,是开源的chatGPT模型中对答效果比较好的。现在UC伯克利学者联手CMU、斯坦福等,再次推出一个全新模型70亿/130亿参数的Vicuna,俗称「小羊驼」(骆马)。小羊驼号称能达到GPT-4的90%性能,下面来体验一下。
原创
发布博客 2023.06.02 ·
4595 阅读 ·
1 点赞 ·
2 评论 ·
15 收藏

Minigpt4实战搭建

Minigpt4虽然放出了网页版但是使用后发现网页体验的话,由于并发量比较大,很容易突然卡顿的现象,所以下面我主要讲解一下如何进行本地部署。之前文章已经介绍过Minigpt4了这里就不重复赘述了,不了解的可以去看看由于经费有限我这里使用的是7B模型,按照文档中所说,7B模型大概需要12G左右,而13B需要24G。
原创
发布博客 2023.06.01 ·
1161 阅读 ·
0 点赞 ·
0 评论 ·
4 收藏

HTTP相关知识

HTTP 是基于 TCP/IP 协议的应用层协议,主要规定了客户端和服务器之间的通信格式,默认使用 80 端口。
原创
发布博客 2023.05.27 ·
1741 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

人人都能GPT!微软开源DeepSpeed Chat帮用户训练模型

DeepSpeed-Chat允许用户使用如下所示的灵活API构建自己的RLHF训练管道,用户可以使用这些API来重建自己的RLHF训练策略。这为创建用于研究探索的各种RLHF算法提供了通用接口和后端。
原创
发布博客 2023.04.21 ·
710 阅读 ·
0 点赞 ·
4 评论 ·
0 收藏

MiniGPT4,开源了

MiniGPT-4 旨在将来自预训练视觉编码器的视觉信息与先进的大型语言模型 (LLM) 对齐。具体来说,在文本方面,作者利用 Vicuna 作为语言解码器,在视觉感知方面,使用了与BLIP-2相同的视觉编码器,并且语言和视觉模型都是开源的。
原创
发布博客 2023.04.18 ·
3212 阅读 ·
0 点赞 ·
0 评论 ·
16 收藏
加载更多