自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 收藏
  • 关注

原创 LangChain开发框架

LangChain是由哈佛大学Harrison Chase于2022年10月开发的开源框架,用于构建基于大语言模型(LLM)的应用程序。作为LangChain生态系统的核心组件,它类似于Hadoop生态中的HDFS,为开发者提供了开发LLM驱动应用的基础框架。该框架包含快速入门教程等学习资源,帮助开发者快速上手。

2026-05-20 23:23:45 18

原创 [Word] 初识

本文介绍了图元的概念及其属性分类,所有可绘制内容(字符、图片等)均视为图元,包含公共属性和特有属性。重点说明了Word文档中代码块的排版规范:使用Consolas(字母数字)和宋体字体,小五字号,置于1×1表格内并添加15%灰色底纹。文末提出了关于粘贴文本时空格显示为小圆圈的现象疑问,该问题可能与格式转换或特殊字符显示设置有关。全文简明扼要地阐述了技术文档处理中的关键概念和实用技巧。

2026-05-20 22:22:22 12

原创 [编程语言实践] 读懂g++的报错信息

本文解析了g++编译器报错信息的组织结构。GCC报错通常遵循"文件名:行号:错误类型:错误描述"的固定格式,包含文件包含链和错误追溯两部分。文件包含链以"In file included from"开头,展示头文件嵌套关系;错误追溯则通过"required from"逆向展示调用链,最终指向错误源头。文中通过具体示例详细拆解了报错信息的语法结构,并解释了关键术语如"In instantiation"和"required from"的含义,帮助开发者更高效地理解编译错误信息。

2026-05-19 16:27:59 37

原创 [编程语言理论] 函数是函数,对象是对象,类是类

摘要:编程语言理论研究关注代码的形式语义而非底层实现。Python中的"函数"并非理论意义上的纯函数,而是融合了函数、对象、闭包等多重特性的混合体。其设计结合了Scheme的闭包、ABC语法和Modula-3模块系统,在理论上扮演着多种角色。尽管Python语法中仍称其为函数,但从编程语言理论角度看,它实际上是一个功能复合体。

2026-05-18 15:45:14 15

原创 [大模型应用开发-提示工程] RAG技术

RAG(检索增强生成)技术通过结合外部知识库优化大语言模型输出。其核心组件Retriever从向量数据库中检索相关文档片段,与用户问题合并后提交给生成模型。实现流程包括:解析文件为文本、分块处理、向量化存储(embedding),最终通过相似度匹配获取相关知识辅助生成。该技术可有效减少模型幻觉,提升回答准确性,适用于电商客服等需要专业知识的场景。

2026-05-18 09:27:43 181

原创 Gradio开发框架

Gradio是Hugging Face推出的开源Python框架,可快速为机器学习模型或Python函数构建Web演示界面。其特点包括:无需前端知识、内置共享功能生成可访问链接。使用采用"三段式"结构:1)定义核心功能函数;2)用gr.Interface绑定输入输出组件;3)通过launch()启动服务,设置share=True即可生成公网链接。该工具适合快速原型开发,建议先掌握基础用法再深入研究原理。

2026-05-17 00:11:26 46

原创 [网络] HTTPS

原始数据 -单向Hash函数(不可逆)-> 数据摘要数据摘要的用途:…

2026-05-17 00:10:49 618

原创 [编程语言理论] Python的作用域与C的作用域之别

本文对比了C语言和Python的作用域机制差异。C语言采用渐进遮蔽的作用域规则,变量声明位置决定作用域起始点,遵循就近原则。Python则采用"独立作用域"机制,作用域内变量必须全局或局部二选一,解释器在编译时会自动处理声明。通过两个Python示例展示了这种特性:函数内若未声明global变量就修改同名变量会报错,而仅引用外部变量则不会。这种设计使得Python的作用域边界更加严格明确。

2026-05-16 10:50:42 154

原创 [编程语言理论] 名称与对象

本文提出一个通用编程语言模型,从语法结构、数据类型、控制流程、函数机制、面向对象特性、异常处理等维度提炼编程语言的共性。该模型包含变量声明、运算符、条件分支、循环结构等基础要素,同时涵盖类与对象、继承多态等高级特性。通过建立这种抽象框架,可快速把握不同语言的核心特征,对比其设计哲学与适用场景,为语言学习和技术选型提供系统化分析工具。模型强调编程范式的统一性,同时保留各语言的特殊性。

2026-05-16 10:33:37 17

原创 [hadoop] Spark编程

Spark分布式读取本地文件的机制解析:当Driver程序指定本地文件路径时,并不会直接传输数据给Executor,而是通过任务调度机制实现分布式读取。具体流程包括:1)Driver解析文件路径并划分数据块;2)将读取任务分配给各Executor;3)Executor根据指定路径直接访问本地文件系统读取对应数据块。这种设计避免了Driver与Executor间不必要的数据传输,提高了处理效率。

2026-05-14 19:33:36 42

原创 [hadoop] 初识Spark

Spark集群入门指南 本文介绍了Spark集群的基本概念和运行机制。Spark集群采用主从架构,启动过程通常由管理员在Master节点执行脚本完成,Worker节点通过SSH连接启动并向Master注册。客户端通过spark-submit提交任务时,Driver进程会与Master节点交互申请资源。 Spark集群的本质特征来源于其资源调度器,同一组物理计算机可以同时组成Spark集群和YARN集群。本地模式与Standalone模式的主要区别在于资源利用方式:本地模式在单机运行,Standalone模式

2026-05-10 21:29:20 348

原创 [算法题] 网页排名图算法PageRank算法

本文介绍了PageRank算法的代码实现,重点展示了基于MapReduce框架的迭代计算方法。PageRank通过分析网页间的链接关系评估网页重要性,其核心思想是:被高质量网页链接的网页通常也更重要。算法实现包含Mapper和Reducer两个主要组件:Mapper负责计算每个网页对其链接网页的PR值贡献,Reducer则汇总这些贡献并更新PR值。代码采用0.85的阻尼系数,通过10次迭代计算最终PR值,并处理了数值精度问题(保留10位小数)。该实现解决了rank leak和rank sink问题,适用于大

2026-05-10 14:47:12 570

原创 [虚拟机] VMware启动Ubuntu虚拟机,但因为ext4文件系统损坏,无法启动的解决方法

摘要:当Ubuntu系统出现ext4文件系统损坏时,可通过恢复模式修复。首先进入GRUB引导菜单选择recovery mode,在恢复菜单中使用fsck -y /dev/sda2命令修复指定分区(注意根据报错信息选择正确分区)。修复完成后选择resume正常启动系统。fsck仅修复文件系统结构,不能恢复误删文件,日常不建议随意使用该命令。

2026-05-07 21:22:04 201

原创 [概率理论] 马尔科夫链

摘要:马尔可夫链由俄国数学家安德雷·马尔可夫于1906年提出,最初是作为纯数学理论研究的工具。其核心特性是"无记忆性",即下一状态仅取决于当前状态。文中以饮料市场份额为例,展示了马尔可夫链的实际应用:通过状态转移矩阵(品牌A→B转换概率)和Python计算,预测短期市场份额变化(3个月)及长期稳态分布(最终A占33.3%,B占66.7%)。该案例演示了马尔可夫链在商业预测中的典型应用,同时介绍了其两种表示方法:转移矩阵和转移图。

2026-05-06 15:17:43 174

原创 [git报错]

文章摘要:本文记录了Git远程仓库认证失败的解决方案。当出现"Authentication failed"错误时,可通过修改远程仓库URL格式解决,即在URL中包含用户名和私人令牌:git remote set-url origin https://用户名:私人令牌@仓库地址。该方法适用于密码或访问令牌认证失败的情况。

2026-05-05 22:18:33 19

原创 [软件测试理论] 设计测试用例

测试用例设计方法及思考引导 摘要:本文介绍了测试用例的基本概念(包含测试环境、操作步骤、测试数据、预期结果的n元组)和设计高覆盖率测试用例的方法论。从功能、界面、性能、兼容性、易用性、安全等六个核心维度出发,提出了结构化思考框架。重点阐述了构建具体测试用例的六大方法:等价类划分法、边界值分析法、场景法、正交表法、判定表法和错误猜测法。特别强调测试设计应基于需求文档,采用"精而简"的原则,通过工具辅助(如allpairs生成正交表)实现高效覆盖。网络测试和安装卸载测试作为补充维度也被提及。

2026-05-05 18:41:25 205

原创 [软件测试理论] 描述BUG,写出Effective的描述BUG的文档

撰写规范化的BUG文档能够降低沟通成本,提高开发效率。有效的BUG描述应具体明确,避免抽象术语,包含版本、环境、复现步骤、预期与实际结果等信息。BUG判定需基于需求文档或用户合理预期,排除主观意见和已知限制。测试人员应关注问题对用户的实际影响,提供充分证据,并按照崩溃、严重、一般、次要四个级别确定优先级。规范的BUG报告有助于快速定位和解决问题,提升软件质量。

2026-05-03 23:43:33 423

原创 UML(统一建模语言)

《UML简明指南:从概念到实践》摘要 本文为UML初学者提供了系统的入门指导。首先明确UML(统一建模语言)是一种以图形为主的建模语言,区别于传统编程语言。UML包含14种图形,分为结构图(如类图、部署图)和行为图(如用例图、时序图)两大类。文章通过"简易订单系统"的实例演示,具体说明如何绘制用例图、类图和时序图等核心图形。用例图用于描述系统功能需求,类图展现系统静态结构,时序图则呈现对象间的动态交互。文中强调UML的核心价值在于解决复杂系统设计与沟通难题,并推荐了drawio等实用工具

2026-04-29 22:41:58 338

原创 [C++编程语言] C++的命名空间

最一般的方法是加命名空间名称及作用域限定符,但这种方法从表面上看并没有比纯C语言命名时添加前缀便捷多少,所以C++又添加了。

2024-04-05 17:10:09 935 1

原创 [算法题] 接近sum问题最快的平均时间复杂度解法的核心思想

所代表的数组会发生逻辑上的变化,现在这里先不讨论,具体在后面,先以上面第一次查找的过程说明,第一次查找时数组。​ 核心思想还是利用二分查找,不过中间值不是通过下标确定的,而是通过数据计算出的中间值确定的。比较,并与上一次记录的差值进行比较,如果这一次的差值小于上一次的差值则记录新的差值。中的最大值与最小值之和,当然每次查找过后,数组。的变化,由上面的证明可知,无需列举出数组。中中间值左边的数包括中间值是由数组。中各个元素的和,因此,删除数组。中各个元素的和,同样的,数组。,给定的有N个元素的数组。

2024-02-17 23:06:14 504 1

原创 [C编程语言] C语言中的分支和循环语句

分支语句,又叫选择语句,有两种,一种是 if 语句,另一种是 switch 语句,分支语句的功能很容易理解,就是做选择,从多个选项中做出选择。

2023-10-28 18:42:23 92

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除