自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

杨海吉

要相信,梦想一触即达

  • 博客(306)
  • 资源 (1)
  • 收藏
  • 关注

原创 JDK15重大更新

目录1.JDK 15的新增功能-新功能和增强功能1.1 Char 在CharSequence中添加了isEmpty默认方法1.2 支持Unicode 13.01.3 JEP 371 隐藏类1.4 添加了对SO_INCOMING_NAPI_ID支持的支持1.5 TreeMap方法的专用实现1.6 jstatd中添加了用于指定RMI连接器端口号的新选项1.7 jcmd中添加了用于编写gzip压缩堆转储的新选项1.8 JEP 378 Text Blocks1.9 为调试模式向jhsdb添加了新选项1.10 适用于

2020-10-21 15:39:31 2149 4

原创 Java 核心技术,程序员必备技能,请来这里Get

程序员必备的技能,Java核心技术,架构师学习资料

2020-08-03 21:35:03 2283

原创 SpringCloud+OAuth2实现统一权限验证,并持久化到Mysql中

社区群聊添加小编微信进入java学习交流群,小编微信:372787553,备注进群OAuth2简介OAuth2.0是OAuth协议的延续版本,但不向后兼容OAuth 2.0即完全废止了OAuth1.0。 OAuth2.0关注客户端开发者的简易性。要么通过组织在资源拥有者和HTTP服务商之间的被批准的交互动作代表用户,要么允许第三方应用代表用户获得访问的权限关键名词在详细讲解OAu...

2020-04-08 13:58:34 3001 1

原创 JDK14的重大更新

一.JDK 14版本中的重大更改1.1 Java SE 14和JDK 14中的一些更改Switch进行了扩展,因此可以用作语句或表达式,以便两种形式都可以使用传统case ... :标签(带有直通)或新case ... -> 标签(不带有直通),还可以使用新的语句从中产生值开关表达式。示例:"->"以表示如果标签匹配则仅执行标签右边的代码。建议每种情况允许多个常量,以逗号分...

2020-03-23 18:58:01 1668

原创 Springboot2.X+Elasticsearch 实现分词搜索

Elasticsearch 安装具体安装步骤网上很多,大家可以借鉴一下;关于分词插件的安装可以执行一下命令:拼音插件./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-pinyin/releases/download/v6.1.1/elasticsearch-analysis...

2019-06-25 18:40:34 4567 3

原创 SpringCloud+OAuth2 统一权限验证

OAuth2 权限统一验证OAuth2简介OAuth2.0是OAuth协议的延续版本,但不向后兼容OAuth 2.0即完全废止了OAuth1.0。 OAuth2.0关注客户端开发者的简易性。要么通过组织在资源拥有者和HTTP服务商之间的被批准的交互动作代表用户,要么允许第三方应用代表用户获得访问的权限关键名词在详细讲解OAuth 2.0之前,需要了解几个专用名词。它们对读懂后面的讲...

2019-05-18 21:46:58 21409 10

原创 中文智能术语纠错系统设计与实现

通过TermDetail构建器可灵活指定术语的权重和领域,权重越高,在相同置信度下越容易被选中。领域枚举值包括。领域自适应性:通过简单的特征词统计实现无监督语境识别。多因子融合评分:平衡编辑距离、拼音、权重等多维度信息。透明化决策过程:内置的分析日志有助于开发者调试与优化词典。未来可扩展的方向引入更精细的拼音混淆集:如z/zhin/ing的加权处理。支持自定义领域特征词:允许用户根据业务需求配置领域关键词。性能优化:对大规模词典(百万级)进行前缀树(Trie)索引优化,减少滑动窗口计算量。

2026-04-22 08:24:54 348

原创 智能纠错系统V2:自定义术语权重升级

SmartTermCorrector V2 升级摘要 SmartTermCorrector V2 在原有智能术语纠错系统基础上,新增了自定义术语权重功能,显著提升了纠错系统的业务适配性。主要升级包括: 权重自定义:支持通过Map或TermDetail为每个术语单独设置权重(0.1-10.0),影响纠错优先级 三种配置方式: 默认权重(V1兼容) Map批量设置权重 TermDetail精细配置(可指定术语、权重和领域) 领域控制:支持手动指定术语领域,避免自动推断错误 权重影响机制

2026-04-21 09:27:38 425

原创 基于 HanLP 与拼音相似度的智能术语纠错系统

本文介绍了一种基于HanLP与拼音相似度的智能术语纠错系统。该系统针对专业领域文本中常见的音近字、形近字错误,通过HanLP分词识别候选术语片段,结合拼音相似度、编辑距离与上下文领域分析进行智能纠错。系统采用多维度评分模型,包括编辑距离、拼音相似度、领域匹配等指标,并支持自定义术语库与领域关键词库。测试表明,该系统能有效纠正"心几梗赛→心肌梗塞"等专业术语错误,同时避免对日常用语的误纠。文章详细阐述了系统架构、核心算法及优化方向,为垂直领域的文本纠错提供了轻量级解决方案。

2026-04-21 09:22:56 631

原创 智能术语纠错器:基于HanLP的高效精准纠错方案

本文提出了一种基于HanLP和编辑距离的智能术语纠错器TermCorrectorFinal。该工具通过HanLP分词划定候选区域,结合编辑距离模糊匹配和智能大小写保留策略,实现了高效精准的术语纠正。核心设计包括:利用分词结果限定纠错范围、内存词典分桶存储、最大编辑距离为1的模糊匹配以及大小写保留机制。系统采用轻量级纯内存架构,支持线程安全集成,特别适用于医学术语、产品名称等专业领域的文本纠错。实验表明,该方法能有效处理拼写错误、同音错别字及大小写变体问题,相比传统词典映射方法具有更高的灵活性和准确性。

2026-04-17 10:38:25 429

原创 基于 HanLP + 编辑距离的术语智能纠错实战

本文介绍了一种基于HanLP和编辑距离的中文医疗术语纠错方案。该方案通过三步实现精准纠错:1)利用HanLP分词和词性标注识别候选语块;2)合并中文连续名词性语块;3)采用滑窗模糊匹配和编辑距离计算实现术语级纠错。方案具有轻量级、易集成等优势,适用于电子病历等专业场景。测试显示能准确纠正"心机梗塞→心肌梗塞"等典型错误,但对多字错误和未登录术语存在局限。未来可通过调整编辑距离阈值或引入拼音相似度进一步提升效果。

2026-04-17 09:27:11 387

原创 中文术语纠错追踪系统详解

本文介绍了一个带追踪功能的中文医学术语纠错与归一化引擎。该工具能自动修正文本中的错别字术语(如"心机梗塞"→"心肌梗塞"),并记录修改详情,包括原始词、修正词、位置和编辑距离。核心功能包括轻量分词(基于FMM算法)、模糊纠错(基于编辑距离)和过程追踪。系统架构包含分词器、术语词典和纠错追踪模块,输出修正后文本和详细修改记录。文章还提供了性能优化建议(如使用HanLP分词器、BK-Tree算法)和扩展方案(支持拼音纠错等)。该工具适用于医疗文本处理、电子病历质控等场景,

2026-04-16 08:48:10 384

原创 Logback和Log4j框架实现日志脱敏

本文介绍了Java中Logback日志框架的脱敏实现方案。通过重写PatternLayout类对日志参数进行深度脱敏处理,并创建MaskedLoggingEvent包装原始日志事件,确保关键字段在输出前被安全处理。核心代码展示了如何覆盖doLayout方法实现参数脱敏,以及如何通过继承ILoggingEvent接口构建脱敏后的日志事件对象。该方法采用双重保障机制:先对参数进行脱敏,再对整个消息进行二次脱敏处理,有效防止敏感信息泄露。

2026-02-05 15:38:53 309

原创 RTSP模拟开发:轻松搭建本地摄像头推流

摘要:本地开发中若需模拟摄像头连接,推荐使用RTSP Simple Server(RSS)。该方案通过三步实现:1)下载并运行单文件RSS服务器;2)用FFmpeg将本地摄像头或视频文件推流至RTSP地址;3)通过ffplay/VLC验证流媒体。关键配置包括指定像素格式(yuyv422)和低延迟参数(zerolatency),支持实时视频循环推流,日志可清晰监控连接状态。适用于无物理摄像头时的开发测试场景。

2025-12-12 13:50:17 625

原创 解决labelImg标记闪退问题

摘要:在使用labelImg进行数据标记时,若遇到Python 3.11下标记闪退问题(canvas.py类型错误),可通过修改canvas.py文件解决。错误源于float/int类型不兼容,修复方案包括降级Python版本或修改代码。本文提供了修复后的canvas.py完整代码,主要调整了绘图相关的类型转换逻辑,确保在PyQt5环境下正常运行。修改后的代码兼容PyQt4/PyQt5,解决了绘制过程中坐标参数类型不匹配导致的崩溃问题。

2025-12-11 08:41:10 259

原创 YOLO模型快速转ONNX全攻略

摘要:本文详细介绍了如何将训练好的YOLO模型(.pt)转换为ONNX格式。通过Ultralytics库的export方法,只需几行代码即可完成转换,支持配置输入尺寸、精度等参数。文章还提供了不同场景下的配置方案(动态输入、GPU加速、移动端优化),以及ONNX模型验证方法和常见问题解决方案。最后展示了使用ONNX Runtime推理和Flask部署的代码示例,帮助开发者快速实现模型部署应用。

2025-12-10 17:06:53 1056

原创 YOLO目标标注与训练全流程指南

本文介绍了使用LabelImg工具标注数据集并训练YOLO模型的完整流程。主要内容包括:1)安装LabelImg标注工具;2)准备原始图片并创建项目目录;3)使用LabelImg进行目标标注,生成YOLO格式的标签文件;4)划分训练集和验证集;5)创建data.yaml配置文件;6)数据检查要点;7)训练命令示例及参数设置。文章提供了详细的步骤说明和代码示例,特别强调了标注注意事项和训练后的效果评估方法(通过map50指标判断)。整个流程适用于安全帽检测、车牌识别等单类别目标检测任务。

2025-12-10 17:00:28 1073

原创 AI Prompt Engineering 设计指南

摘要: 根据应用场景选择适合的Prompt类型是关键。信息性Prompt适合事实查询(如客服问答),对话式Prompt用于多轮交互(如健康咨询),指令性Prompt生成结构化输出(如代码编写),创造性Prompt激发原创内容(如故事创作),混合型Prompt可结合多种需求。优化技巧包括明确问题范围、角色设定、分解任务及提供示例。选择时需考虑目标功能、用户需求和模型能力,并通过测试迭代优化Prompt设计。

2025-07-15 20:35:49 635

原创 SpringAI整合RAG构建自己的本地知识库

ETL(Extract, Transform, Load)管道用于创建、转换和存储Document实例。Document类包含文本内容、元数据以及可选的其他媒体类型,例如图像、音频和视频。:实现接口,负责从 PDF、文本文件等来源读取文档。:实现接口,用于对文档进行处理或转换。:实现接口,负责将处理后的文档写入目标存储。Document对象通常由从各种格式的文档中创建而来。要构建一个简单的 ETL 管道,只需将这三类组件依次串联即可。

2025-07-09 14:33:46 1250

原创 数据分析与未来规划系统AI提示词

摘要: 该提示词构建了一个数据驱动的预测系统,专注于多阶段趋势分析与战略规划。核心功能包括: 分层预测(3/5/10年),采用不同算法(如指数平滑、蒙特卡洛模拟); 结构化输出,含关键变量、可视化图表、资源分配建议及风险预警; 场景化分析(基准/乐观/悲观),并标注核心假设条件; 动态风险监控,检测数据漂移与衰退信号。系统要求严格区分相关性/因果性,并声明长期预测的置信度衰减特性。适用于行业级战略规划,需输入数据集+行业关键词激活对应分析模型。 (字数:149)

2025-05-29 10:46:07 432

原创 汽车行业AI助手系统提示词

为汽车行业设计的综合型AI系统提示词,适用于销售、客服、产品咨询等场景,可根据需求调整

2025-05-29 10:38:27 666

原创 无提示词时RAG与模型知识的取舍机制

在 LangChain4j 中,当系统提示词为空时,模型对 RAG(检索增强生成)和自身通用知识的取舍机制依赖于框架的默认设计和模型的内在逻辑。框架默认会在每次用户提问时自动执行 RAG 检索,但模型是否使用检索结果取决于内容相关性和模型的知识边界。工具调用则完全依赖 @Tool 注解中的自然语言描述。模型会综合工具调用、RAG 检索结果和自身知识生成最终回答,优先级通常为工具调用 > RAG 检索结果 > 模型自身知识。开发者可以通过优化工具描述、RAG 检索策略和模型参数来间接控制模型行为。

2025-05-20 15:54:56 732

原创 模型如何决定调用RAG还是Function Calling(Tool)

在 LangChain4j 等框架中,模型通过自身的推理能力和开发者设计的提示工程共同决定调用 RAG(检索增强)还是 Function Calling(工具调用)。核心判断逻辑基于用户问题的需求:RAG 适用于需要外部知识库中的静态信息,而 Function Calling 则用于需要动态操作或实时数据的场景。开发者可以通过工具描述、提示词设计、元数据过滤等方式显式控制模型的决策流程。模型通过语义理解和逻辑推理,结合开发者的配置,自动选择最合适的处理方式。

2025-05-20 15:50:02 1302

原创 Function Calling + RAG 提升模型的知识覆盖能力和动态信息处理能力

通过这种结合方式,你可以构建一个既能回答深层次知识问题,又能执行实时操作的智能体,非常适合企业知识库、客服系统等复杂场景。,二者在 LangChain4j 中能形成互补优势。结合,可以显著提升模型的。

2025-05-20 15:31:46 989

原创 LangChain4j简介

LangChain4j 是一个旨在简化将大型语言模型(LLM)集成到 Java 应用程序中的开源库。它通过提供统一的 API,支持 15+ 个 LLM 提供商和 20+ 个嵌入存储,使开发者能够轻松切换不同的模型和存储,而无需重写代码。LangChain4j 还提供了一个全面的工具箱,包括从低级提示模板到高级模式如代理和检索增强生成(RAG)的工具。此外,它提供了丰富的示例,帮助开发者快速上手构建各种 LLM 驱动的应用程序。

2025-05-20 13:45:02 1175

原创 智能客服系统提示词模板

本文介绍了为三级甲等医院设计的智能挂号客服系统提示词模板,旨在通过AI技术优化挂号流程,提升患者体验。系统核心功能包括智能分诊挂号、医生排班查询、预约改签/取消、就诊前提醒、医保政策解读及报告查询引导。挂号流程规范涵盖症状预诊、科室匹配、号源选择及身份核验,确保高效准确的医疗服务。对话管理机制处理号源冲突和紧急情况,输出规范提供预约确认凭证和提醒服务。数据安全约束保护患者隐私,智能优化策略通过号源预测和错峰引导提高效率。系统对接要求确保实时数据更新和容灾机制,典型对话流程展示系统如何引导患者完成挂号。

2025-05-20 11:07:27 1029

原创 AI场景应用提示词编写规则

编写合格的AI场景应用系统提示词需要遵循一定的原则和结构规则,同时结合具体场景需求灵活调整。通过以上规则和模板,可系统化设计高效提示词。实际应用中需灵活组合框架元素,并通过持续迭代优化输出效果。

2025-05-20 10:54:53 1207

原创 git commit message helper结合 commit-msg 校验提交格式

关于 git commit message helper 他是一个开源的插件,可以在idea 和vscode中安装使用,这里不多做介绍,可以参考https://developer.aliyun.com/article/1601042。我们直接将插件提供的辅助服务与git commit-msg结合使用,方便统一大家的提交信息,统一风格。commit-msg 文件位于项目路径下.git文件下\hooks里,.git\hooks。

2024-12-19 15:36:13 992

转载 用Java实现排列、组合算法

2、有时候,我们不仅需要知道排列或组合的数量,而且需要知道有哪些排列或组合,并列举出所有的排列或组合,人工列举工作量大而且容易出错,那么,如何利用计算机帮忙列举出所有的这些排列或组合呢?那么,计算排列或组合的数量,通过上面的公式就很容易就算出来了,其Java的实现如下。经验证,输出的结果正确,同预期结果相符。(1)完整的测试代码如下。

2024-08-21 15:17:10 1232

原创 easypoi实现数据导出与动态表头

话不多说,直接上代码,这里也包含一些代源码重写的方式。

2024-07-14 20:26:55 798

原创 java多线程任务编排

在java里有很多高并并发和多线程的工具高,本身没也可以实现任务编排,但是代码量和复用性很差,要考虑的事情很多,一旦遗漏就会出现异常,最近也在做这样的task,也借机会,开发了一个小的工具包,增加了复用性,代码也简单。,目前这个项目在开发中,也希望有兴趣的朋友一起加入。

2024-07-02 17:37:51 1011

原创 大数据领域常用的中间件

数据流转工具 | Active | StreamSets | approved | 数据集成 | 数据流转工具 | 3.21.0 | | Moderate || 数据流转工具 | Active | Apache Kafka。

2024-07-02 17:02:54 1195

原创 python 自动下载指定网站证书

【代码】python 自动下载指定网站证书。

2024-06-12 18:06:06 327

原创 拥抱 GitFlow,优化开发流程:团队协作的最佳实践

如果 Feature2 是从一个单独的分支合并过来的,你可以回滚这个整合提交(merge commit)。如果回滚操作过于复杂,可以创建一个新的临时分支,并选择性地合并其他功能,排除 Feature2。通过以上方法,你可以准确地回滚 Feature2 的代码,确保发布的版本只包含需要发布的功能。分支中只包含已经完成并且经过测试的功能,从而避免未完成功能的提前暴露。准确地回滚特定功能(如 Feature2)的代码,可以使用 Git 的。下面是详细的步骤,帮助你准确地回滚 Feature2 的代码。

2024-06-12 14:06:26 1335

原创 ANTLR Aviator语法引擎对比

ANTLR、Aviator、JEXL、MVEL、Groovy、JavaCC、JFlex、CUP 和 Parboiled 的详细对比表:

2024-06-12 14:03:40 857

原创 ANTLR Aviator语法引擎对比

ANTLR、Aviator、JEXL、MVEL、Groovy、JavaCC、JFlex、CUP 和 Parboiled 的详细对比表:

2024-05-20 11:13:42 1210

原创 自定义 spring retry持久化方式

try {} }try {} }try {} }import orgtry {} }try {} }import orgtry {} }try {} }try {} }@Overridetry {在这个示例中,我们创建了一个名为的自定义重试模板,它使用了一个。

2024-03-12 14:12:26 724 1

原创 Spring Retry的使用与介绍

你可以通过实现接口来添加自定义的重试监听器。@Override// 自定义逻辑然后,你可以将这个监听器注册到中。通过实现接口,你可以定义当重试失败后的恢复逻辑。@Override// 恢复逻辑。

2024-03-12 13:51:16 961

原创 Spingboot 开发一个JSON ETL

该工具不仅支持用户上传JSON数据进行处理,更具备通过HTTP自动调用指定URL获取数据的功能,并在数据到达后即刻进行清洗和转换, 以满足不同场景下的数据处理需求。JSONCleanseETL 提供了多种数据输入方式,包括上传 JSON 文件、直接粘贴 JSON 数据以及通过 HTTP 自动调用指定的 URL 获取数据, 为用户提供了更加灵活和便捷的数据导入方式。自己也找了一些工具,并没有发现比较好用的。最近参与的项目中,发现需要对接跟多的第三方API,而且这些API都是Restful的接口,返回的都是。

2024-03-07 14:11:05 1071

原创 常见的企业架构图

技术企业架构图:揭示企业技术基础设施的蓝图业务流程架构图:优化企业运营的关键数据架构图:如何管理和分析企业数据应用架构图:构建企业级应用的指南企业架构图的演变:从传统到现代的转变云计算与企业架构图:如何有效利用云资源企业架构图与数字化转型:共同迈向未来安全性在企业架构图中的作用:保护企业免受威胁企业架构图与业务战略:如何实现目标企业架构图的五个核心组成部分:构建稳健企业

2024-02-28 15:55:17 789

SpringBoot+MyBatis+Redis

本项目基于SpringBoot实现,整合Mybatis+Redis,实现了简单的业务逻辑,希望对初学者有所帮助,内含sql

2018-11-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除