- 博客(70)
- 收藏
- 关注
原创 OpenAPI 详解
定义:OpenAPI 不是单一技术,而是一类标准化、开放型 API的总称,通常遵循 RESTful 架构风格,或采用 OpenAPI Specification(OAS,原 Swagger Specification)定义接口描述格式,让开发者无需关注底层实现,即可快速调用第三方功能。本质:打破系统间的“信息孤岛”,通过统一的接口规范和文档标准,降低跨平台集成成本,实现功能复用(如支付接口、地图服务接口)。
2025-12-09 02:57:21
335
原创 大语言模型(Large Language Model, LLM)系统详解
定义:大语言模型(LLM)是语言模型(Language Model, LM)的进阶形态,通常以Transformer为核心架构,在万亿级tokens的通用文本数据上预训练,能通过少量提示(Prompt)适配翻译、创作、推理等多样化自然语言任务,无需针对单一任务重新训练。本质:通过学习海量文本的语义、语法、知识规律,构建通用的语言表征与生成能力,类比人类通过海量阅读形成的语言认知体系,可泛化到未见过的场景。
2025-12-02 22:21:27
464
原创 语言模型(Language Model, LM)系统详解
定义:语言模型(Language Model, LM)通过学习海量文本数据的词汇、语法、语义规律,能够量化文本序列的合理性(如计算“我吃饭”vs“饭吃我”的概率),或根据给定上下文生成连贯、有意义的文本。本质:将自然语言转化为可计算的数学模型,让机器“理解”并“生成”人类语言,核心是捕捉语言的上下文依赖关系。
2025-12-02 22:13:48
519
原创 LangChain 系统详解
LangChain是一款开源的大语言模型(Large Language Model, LLM)应用开发框架,2022年10月由Harrison Chase开源,核心价值是为开发者提供模块化组件,快速串联LLM与外部工具、数据,降低复杂AI应用的开发门槛,以下分点梳理核心内容:
2025-12-02 22:04:20
286
原创 信息检索(Information Retrieval, IR)详解
定义:信息检索(Information Retrieval, IR)是在海量信息资源(文本、图像、音频等)中,通过特定算法挖掘用户查询与信息的相关性,按相关度排序返回结果的过程,区别于数据库“精准匹配”,更侧重“语义相关”与“效率优先”。本质:建立“用户需求→信息资源”的映射桥梁——将非结构化的信息转化为可检索的特征表示,通过相似度计算快速定位目标信息,平衡召回率(Recall)与精确率(Precision)。
2025-12-02 21:58:01
501
原创 推理(Inference)系统解释
定义:推理(Inference)也被称为“模型推理/预测”,区别于训练(Training)阶段的参数迭代优化,推理阶段模型固定参数,仅执行前向计算(Forward Computation),将输入(如文本、图像、语音)映射为目标输出(如分类结果、生成文本、推荐列表)。本质:模型将预训练学到的规律和知识应用于新数据的过程,类比人类“用已掌握的知识解决新问题”,是AI模型产生实际价值的核心环节。
2025-12-02 21:45:07
491
原创 FAISS系统解释
定义:FAISS是基于C++编写、支持Python接口的库,专注解决“高维向量近邻搜索”问题——给定查询向量,快速从百万/亿级向量库中找到相似度最高的Top-K向量。定位:区别于传统数据库的精准匹配,FAISS主打“近似最近邻搜索(Approximate Nearest Neighbor, ANN)”,在精度与检索速度间做平衡,适配大规模向量场景。
2025-11-30 12:44:48
453
原创 #嵌入(Embedding)系统解
定义:嵌入(Embedding)也被称为“向量嵌入”,是通过模型将离散的、高维的原始数据(如单词、句子、图片特征)转换为连续的、低维的实数向量,向量的维度通常为几十到几千(如128维、768维)。本质:把“语义/特征相似性”转化为“向量空间距离”——相似的内容在向量空间中距离更近,反之更远。例如“苹果(水果)”和“香蕉”的向量距离,远小于“苹果(水果)”和“苹果(公司)”的向量距离。
2025-11-30 12:36:57
273
原创 上下文窗口(Context Window)系统解释
定义:模型在单次交互中(含用户提问、历史对话、系统提示)可处理的文本总量上限,通常以“令牌(Token)”为计量单位(1 Token≈0.75个英文单词/0.5个中文汉字)。本质:模型的“短期记忆容量”——类比人类对话时能记住的前文内容长度,超出范围的信息会被模型“遗忘”,无法参与当前推理。
2025-11-30 12:29:35
295
原创 思维链(Chain of Thought, CoT)系统解释
思维链是2022年谷歌在论文中提出的大模型提示词(Prompt)技术,核心是引导大语言模型(Large Language Model, LLM)像人类一样拆解复杂问题,通过输出连贯的中间推理步骤得出最终答案,以此提升模型推理准确性与可解释性。
2025-11-30 12:21:27
384
原创 什么是灾难性遗忘
灾难性遗忘(Catastrophic Forgetting)是机器学习领域(尤其深度学习)的核心问题,指模型在学习新任务时,会快速丢失之前学习过的旧任务知识,导致旧任务性能大幅下降,且这种遗忘并非渐进式,而是“断崖式”的。
2025-11-30 12:13:03
329
原创 智能体核心知识十讲:从技术到应用的通俗拆解
智能体是能自主感知环境、做决策并行动的“AI实体”,区别于传统AI的“被动工具属性”,像有目标的“数字机器人”。物流机器人通过摄像头感知货架(感知),规划抓取路径(决策),控制机械臂行动,再根据抓取结果调整力度(反馈)。智能家居的温控智能体,会根据传感器数据自动开关空调,不用手动调节。:预计2026年半数中国500强数据团队用智能体处理数据,从办公自动化到城市治理全面落地。多智能体如物流系统中,规划、配送、仓储智能体协同运作。:浪潮“数字病人”智能体模拟病例,让医学生实操训练,还能分析薄弱点定制方案。
2025-11-29 15:34:20
205
原创 详解Shell中的if分支(单个条件、多个条件)
if后面只有唯一的一个条件,这个条件就是最后一个条件,这唯一的条件成立,也相当于最后一个条件成立,这唯一的条件不成立,也就相当于最后一个条件不成立。if后面多个条件,核心就是只看最后一个条件的是否成立,如果成立,那么可以执行then后面的命令,否则,不能执行then后面的命令。if后面单个条件,如果条件成立,那么可以执行then后面的命令,否则,不能执行then后面的命令。第一个条件成立,第二个条件不成立,也就是最后一个条件不成立,不能执行then后面的命令。条件为假,那么不执行then后面的命令。
2025-11-09 13:17:16
336
原创 详解Shell脚本中的变量
Shell把一切变量的赋值视为字符串,需要注意的是,变量名、赋值号、值这三者之间不能出现空白字符。大家好,我是大白,今天我来详细讲解一下Shell脚本中变量的命名、赋值以及常量的用法。在扩展中,有的变量名在上下文中容易出现歧义,这时候可以用花括号把变量名括起来。还有一种更严谨的用法,那就是强制常量不变性,使用declare命令实现。把命令的执行结果赋值给d,需要双引号扩起来,命令放在$()里面。把带有空格的字符串赋值给变量b,因为有空格,所以需要双引号。算术扩展赋值给变量e,需要把算术放在$(())里面。
2025-11-08 16:08:18
274
原创 如何创建一个Shell脚本
为了便于维护,脚本要放在适当的目录下, 允许系统所有用户使用的脚本放在 /usr/local/bin 中,超级用户使用的脚本放在 usr/local/sbin。这一行的作用是告诉内核使用哪个解释器来执行接下来的脚本,shebang是sharp-bang的缩写,sharp表示符号 “#”,bang表示符号 “!不指定脚本的路径,就会从环境变量PATH中搜索可执行脚本,默认情况下是找不到的,你可以用以下命令查看PATH的内容。在 .bashrc 文件中加入下面这一行,把~/bin添加到PATH中。
2025-11-08 09:29:36
193
原创 Python中json模块的编码和解码
javascript object notation, 翻译一下就是javascritpt 对象表示法。json是一种轻量级的数据交换格式,容易阅读和编写,支持的数据类型有:字符串、数字、数组和对象。在Python中,可以用json模块处理JSON的编码和解码问题。将Python对象编码为json字符串。以上一个例子的打印结果为JSON字符串。将JSON字符串解码为Python对象。
2024-08-02 11:47:59
349
原创 程序们,程序的稳定性、发布、发布周期、版本号用英语咋说?
每天花几分钟,学习几个基本的常用的技术词汇,一段时间下来,你会发现自己看到英文技术文档、程序提示报错也慢慢有熟悉的感觉了。我们可以发现,熟悉了关键的词汇,一段英文句子的意思我们几乎都能搞明白,所以,一开始不需要太在意语法和发音,这些都是排在第二、第三优先级,排在第一优先级的是积累基础词汇和短语。
2023-03-16 06:53:56
967
原创 C++主要由四大模块组成
起初,C++是C语言加上一些面向对象特性。通过不断演变,现在C++已经是一门多种泛型编程语言。支持过程形式、面向对象形式、函数形式、泛型形式、元编程形式。C++可以看做是以下几个模块组成的:1、C语言C++是以C语言为基础的,许多概念是从C语言继承过来的,比如区块、语句、预处理器、内置数据类型、数组、指针等等。C语言与C++相比,具有一定的局限性,比如C语言没有模板、异常、重载等概念。2、面向对象面向对象模块给C++引入了一些概念,比如类、封装、继承、多态、动态绑定等等。3、模板模板给C++带
2023-02-08 22:01:15
1223
原创 python中两颗星**的使用方法
和一颗星操作符类似,两颗星操作符的作用也是打开容器取数据,让数据作为函数的参数使用。不同的是一颗星操作符是打开列表和数组,两颗星操作的是字典。def add(a=1, b=2, c= 3): print("{}+{}+{} = {}".format(a, b, c, a+b+c))add()dict_1 = {"a": 4, "b": 5, "c": 6}add(**dict_1)# 运行结果1+2+3 = 64+5+6 = 15...
2022-01-27 11:27:17
1225
原创 python的一颗星*的作用和用法
*Python中,一个星 的作用就是拆开容器取出数据, 也就是打开列表list或数组tuple,取出里面的数据,提供给函数作为参数使用。# range()函数一般需要两个参数,一个start, 一个stop, 以下是常规用法for i in range(1, 5): print("i: ", i)"""这是执行结果i: 1i: 2i: 3i: 4"""#使用* 可以达到同样的效果list_1 = [1, 5]for i in range(*list_1):
2022-01-26 10:34:22
716
1
原创 python 如何合并多个dict
a = {"a": 1, "b": 1}b = {"a": 2, "b": 2}c = {"c": 3}result = dict()tmp = str(result)result.update(a)print("{}.update({}) = ".format(tmp, a), result)tmp = str(result)result.update(b)print("{}.update({}) = ".format(tmp, b), result)tmp = str(resu
2022-01-26 10:04:25
3133
原创 SSH登录步骤
SSH登录格式:ssh [用户名]@[ip地址], 回车, 比如, ssh root@0.0.0.1 ;如果需要切换用户,su [用户名], 比如 su test1;从普通用户切换到root用户,可以使用sudo su 或 su;
2022-01-24 16:43:17
1983
原创 使用python关闭浏览器
这是一段使用python关闭谷歌浏览器的简单代码import os, sys# linux系统if "win" not in sys.platform: browserName = "chrome" cmd = "pkill {}".format(browserName)else: #windows系统 browserName = "chrome.exe" cmd = "taskkill /f /t /im {}".format(browserName)
2022-01-12 11:57:37
2051
1
原创 mysql的group by的用法
1. 用途根据一个或多个列对结果集进行分组2. 可以在分组的列上使用的函数SUM,COUNT,AVG3… 案例SELECT age, COUNT(age) as age_count FROM students where class=1 GROUP BY age;从学生中找出1班的学生,按年龄分组,并统计每个年龄的学生数量4. WITH ROLLUP的用法可以在实现分组的数据上进行统计(SUM,COUNT,AVG),比如:SELECT age, COUNT(age) as age_cou
2022-01-10 19:48:00
565
原创 NLP可以处理哪些问题
1.句法语义分析2.信息抽取从指定文本中提取重要信息,比如时间、地点、人物等。节约人力成本、节约时间.3.文本数据挖掘包括分裂、聚类、情感分析、对信息进行可视化处理4.机器翻译通过自动翻译,把输入的源语言转化为另一种语言文本5.信息检索6.智能问答系统对输入的自然语言问题进行分析,然后根据分析结果匹配知识库中的候选答案,最后使用排序机制获得最优答案进行回复。7.对话系统8.文本生成9.根据限定条件或输入文本,生成符合要求的文本;10.舆情分析通过收集和处理海量信息,实现对网络舆
2022-01-06 19:44:39
1256
原创 什么是NLP
NLP是natural language processing 的缩写,翻译过来就是自然语言处理,研究如何把人类语言转化为计算机可以理解的指令。NLP解决计算机与人类语言的互动问题,尤其是解决如何自动化处理大规模的自然语言语料的问题。...
2022-01-06 19:34:41
785
原创 什么是docker
1.定义:docker是开源的应用容器引擎;2.开发语言:GO语言;3.功能:打包应用以及依赖包到一个容器;4.docker的版本分类(1)CE(community edition)社区办;(2)EE(enterprise edition)企业版;
2022-01-05 19:46:54
235
空空如也
appium 测试andriod app , 如何输入中文
2024-05-30
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅