- 博客(176)
- 资源 (12)
- 收藏
- 关注
原创 Embedding模型怎么选?
摘要: 本文对比了6款主流Embedding模型的核心特点与适用场景: 1️⃣ BGE-M3:多语言/长文本RAG首选,支持100+语言; 2️⃣ text-embedding-3-large:英文场景精度顶尖,向量维度可调; 3️⃣ Jina-embeddings-v2:轻量化实时推理,RT<50ms; 4️⃣ xiaobu-embedding-v2:通用中文优化,适配日常检索; 5️⃣ M3E-Turbo:中文轻量级本地部署,适合专业领域; 6️⃣ stella-mrl-large-zh:中文大数
2026-03-20 18:34:00
342
原创 DBeaver 连接phoenix server
配置Phoenix JDBC驱动的步骤:1. 添加驱动时填写类名org.apache.phoenix.queryserver.client.Driver;2. 设置URL为jdbc:phoenix:thin:url=http://172.16.0.7:18765;serialization=PROTOBUF;3. 添加完成后点击"找到类"按钮选择指定类;4. 如需额外驱动包,需按图示操作添加依赖。注意保持URL格式正确,包括端口号18765和序列化协议PROTOBUF。
2026-03-12 12:13:18
41
原创 phoenix-queryserver 6.0.0安装
本文介绍了Apache Phoenix Query Server的安装配置步骤:首先从官网下载安装包并解压,将客户端jar文件复制到指定目录;然后设置环境变量,包括调整Query Server堆内存大小(默认1G可修改为4G)和日志目录;接着启动Query Server服务;最后通过sqlline.py验证连接,并可通过jps命令检查堆内存配置是否生效。
2026-03-12 11:37:56
416
原创 openClaw 10个必装开荒 Skills
《OpenClaw必装10大插件指南》精选10款新手必备插件:1️⃣安全检测skill-vetter;2️⃣联网搜索tavily-search;3️⃣记忆增强self-improving-agent;4️⃣办公神器gog;5️⃣开发工具github;6️⃣速读助手summarize;7️⃣知识管理ontology;8️⃣主动执行proactive-agent;9️⃣插件推荐find-skills;🔟测试工具weather。安装顺序建议从安全基础到生产力工具逐步添加,避免同时安装过多插件。常见问题提醒:安装
2026-03-09 12:16:02
1413
原创 mysql抖动,内存刷脏页
平时的工作中,不知道你有没有遇到过这样的场景,一条 SQL 语句,正常执行的时候特别快,但是有时也不知道怎么回事,它就会变得特别慢,并且这样的场景很难复现,它不只随机,而且持续时间还很短。当内存数据页跟磁盘数据页内容不一致的时候,我们称这个内存页为“脏页”。内存数据写入到磁盘后,内存和磁盘上的数据页的内容就一致了,称为“干净页”。平时执行很快的更新操作,其实就是在写内存和日志,而 MySQL 偶尔“抖”一下的那个瞬间,可能就是在刷脏页(flush)。那么,什么情况会引发数据库的 flush 过程
2026-03-04 09:26:01
344
原创 docker迁移root目录
迁移原因:磁盘根目录满了,通过命令du -h --max-depth=1发现/var/lib/docker占用的空间过大把 Docker 的 root 目录(默认 )迁移到新位置,同时完整保留已有镜像、容器、卷,只需 4 步,零 downtime(Docker ≥ 20.10 验证可行):1. 停止 Docker 服务2. 迁移现有数据(保留权限、硬链接)-a = 保留权限、时间戳、软硬链接;-P = 进度+断点续传。数据量大可先做第一次全量,再停 Docker 做第二次增量(几
2026-03-04 09:22:07
45
原创 cursor界面布局乱了,怎么还原
摘要:工作区和对话区布局变化导致操作不习惯,可通过以下步骤还原:进入layout设置,选择Editor选项即可恢复原界面。操作简单快捷,帮助用户快速适应界面调整。(50字)
2026-03-03 11:31:33
587
原创 华为云弹性公网ip、nat、ELB的关系
一句话关系一、各自角色弹性公网 IP(EIP)独占型公网 IP + 带宽,可绑定到 ECS/裸金属/NAT/ELB/VIP,一个 EIP 同一时间只能绑定一个资源。NAT 网关把 EIP 当作“外网出口”,通过 SNAT 让私有子网多台 ECS;通过 DNAT 把 EIP + 端口映射到私网 ECS,让。弹性负载均衡(ELB)本身不带公网能力;创建公网型 ELB 时系统会自动分配一个 EIP(也可手动绑定),再把入站流量按策略分发给后端;回包统一经 ELB 内网返回。
2026-03-02 20:00:00
1187
原创 BERT从入门到实战:3分钟搞定文本相似度计算
本文详解了BERT在文本相似度计算上的优势及两种工业级实现方法。传统TF-IDF无法区分语义(如"苹果"的水果和公司含义),而BERT通过双向编码和上下文理解能准确捕捉语义差异。文章提供了两种实现方案:1)原生BERT的句向量余弦相似度,速度快但精度有限;2)Sentence-BERT的微调方案,专门优化语义相似度任务,精度更高。通过智能客服案例展示了实际应用,并给出选型建议:原生BERT适合快速验证,Sentence-BERT适用于生产环境。文末提供安装指南和进阶方向,帮助开发者快速落
2026-02-28 11:25:08
439
原创 AI大模型常见面试题分享
摘要:本文梳理了大模型及Transformer相关的常见面试问题及回答建议。内容涵盖大模型定义、与传统模型区别、Transformer结构原理、性能评估指标、优化方法、计算资源解决方案、可解释性保障等核心知识点。针对每个问题提供了结构化回答框架,包括技术原理阐述和实际应用案例。文章还提供了获取完整面试资料的途径,适用于准备AI领域技术面试的求职者。全文采用问答形式,重点突出大模型和Transformer的关键技术要点及面试回答技巧。
2026-02-27 17:33:15
324
1
原创 kafka集群监控
本文介绍了Kafka监控系统的搭建流程:1)在K8s上部署kafka-exporter;2)配置Prometheus监控任务指向Kafka服务地址;3)在Grafana中配置监控面板。同时提供了查看Kafka消费组状态的命令行方法,包括必要的SSL/SASL认证配置参数。文中还包含了client.properties配置文件的详细内容,涉及超时设置、安全协议等关键参数。最后提示可通过公众号获取更多技术资讯。
2026-02-27 15:30:00
205
原创 华为云服务器执行df-h,df-i没反应
摘要:本文分析了Linux系统中执行df命令无响应的问题,发现是由于远程NFS挂载点网络故障导致。核心原因是目标IP不可达(Destination Host Unreachable),可能由路由缺失、网络链路中断或目标设备关机引起。解决步骤包括:1)检查并添加路由;2)排查交换机/路由器及物理链路;3)验证目标设备状态。文章还提供了详细的NFS重新挂载命令及参数说明,建议关注"码农闲聊室"公众号获取更多技术资讯。(149字)
2026-02-27 14:12:45
575
原创 claude code 安装及常见安装问题
摘要:本文介绍了Claude Code的安装配置指南。系统要求包括macOS10.15+/Ubuntu18.04+/Windows10+操作系统,Node.js 18.0.0+和npm 8.0.0+。安装步骤包括全局安装@anthropic-ai/claude-code包,并提供了解决网络问题的镜像源设置方法。配置部分指导用户创建settings.json文件,设置API密钥、基础URL和模型参数。最后提示可关注"码农闲聊室"微信公众号获取更多信息。(149字)
2026-02-26 15:59:15
340
原创 mysql死锁
这是一个典型的 MySQL 死锁案例,由两个并发事务(和尝试向同一个表中插入具有相同索引键值的行时引起。两个事务都在等待对方释放锁,最终 MySQL 的死锁检测机制介入,回滚了其中一个事务()以打破僵局。事务最终状态数据库中的结果应用程序的感知事务 1 (3463900)成功提交成功插入了一条记录操作成功,没有异常事务 2 (3463902)被回滚没有插入任何记录捕获到死锁异常 (Error 1213)关键结论:应用程序必须捕获这个死锁错误并进行处理。
2026-02-26 15:29:12
635
原创 普通用户无法使用docker命令
摘要:文章记录了解决Docker权限问题的步骤。当连接Docker守护进程socket时出现权限拒绝错误,解决方案包括:1)创建docker用户组;2)修改/var/run/docker.sock文件属组为docker并保持0660权限;3)重启Docker服务;4)将用户加入docker组;5)可选执行newgrp使组信息立即生效。最后验证用户组包含docker且能正常执行docker命令,确保脚本正常运行。
2026-02-26 15:22:24
38
原创 Word文档 - 精准定位与高亮
摘要:该Python脚本是一个智能Word文档违规内容标记工具,支持精确识别正文、表格及嵌套表格中的违规内容,并保留原有样式。采用坐标定位系统(如"t1_r2_c2_p0")实现字符级精准标记,通过书签标识(如"vio_body_2_8")便于追踪。核心模块包括通用高亮引擎(分割文本+样式保留)、智能分发器(自动选择处理策略)和嵌套表格处理器(递归解析多层结构)。适用于广告法词汇检测、敏感内容标记等场景,建议结合OCR技术实现批量处理。后端仅需解析违规内容及坐标,前端
2026-02-13 02:30:00
392
原创 虚拟机磁盘扩容
文件系统 容量 已用 可用 已用% 挂载点。信息: You may need to update /etc/fstab.设置 → 硬盘 → 扩展 → 输入新大小(≥ 原大小)→ 确定。完成后虚拟磁盘已变大,但 Linux 里。宿主机侧扩容(任选你用的软件)仍看不到,需要第 2 步。使用 /dev/sda。
2026-02-12 03:00:00
542
原创 ragflow核心功能点
RAGFlow知识库系统提供深度文档理解、智能检索和多源数据处理能力,支持20+文件格式解析和复杂排版处理。其特色功能包括可视化模板切片、多路混合检索、知识图谱构建和可信溯源机制,显著降低AI幻觉。系统兼容多种数据源和模型,提供自动提问优化、沙箱安全环境和中文优化支持,适用于企业知识库、金融科技、政务办公等场景。通过高质量知识提取和完整工程实现,满足对复杂文档处理和高准确性要求的业务需求。
2026-02-10 02:00:00
623
原创 vscode断点调试next.js
本文介绍了如何为Next.js项目配置调试环境。在工程目录下创建launch.json文件,包含三种调试配置:1)调试服务端代码的"Next.js:debug server-side";2)调试客户端代码的"Next.js:debug client-side";3)全栈调试的"Next.js:debug fullstack"。配置中设置了程序路径、参数、环境变量等工作区相关参数,并支持Chrome调试器集成。最后通过选择"Next.js:
2026-01-31 05:00:00
96
原创 idea执行正常,打包成exe,出现java 堆内存不足
摘要:分析发现Java应用内存溢出问题源于launch4j配置中的堆内存设置未生效。原配置使用initialHeapSize/maxHeapSize标签无效,改为在jre配置中添加-Xms和-Xmx参数后问题解决。通过MAT工具确认实际使用内存仅1G多,但最大分配4G未生效,检查发现需改用opts标签指定JVM参数(-Xms526m -Xmx4096m等)才能正确设置堆内存大小,重新打包后配置生效。(149字)
2026-01-31 02:00:00
56
原创 ragflow 几种切片方法说明
摘要:本文介绍了15种文档切片方法,每种方法针对特定文档类型和场景进行优化。通用文档处理推荐Naive方法,学术论文、法律文档等专业内容有专用切片方式(Paper、Laws)。特殊格式如表格(Table)、演示文稿(Presentation)、图片(Picture)等均有对应处理方法。还包含知识图谱构建(KnowledgeGraph)、音频转录(Audio)等高级功能。选择建议部分提供了各类文档的最佳处理方法,如技术手册用Manual,问答数据用QA等。这些方法通过不同技术(OCR、语音识别、结构化提取等)
2025-09-28 03:30:00
1783
原创 使用logrotate + crond定时任务切割nginx日志
摘要:本文介绍了在Docker安装的Nginx环境下配置日志轮转的方法。主要内容包括:1)检查/安装logrotate工具;2)配置/etc/logrotate.d/nginx文件,设置日志存储路径、轮转周期(每日)、保留天数(14天)等参数;3)详解各配置参数如压缩、截断等作用;4)验证配置语法并手动执行;5)通过crontab设置每日自动执行。最后还提供了查看日志的方法。适用于需要对Nginx日志进行自动化管理的场景。
2025-09-04 08:00:00
415
原创 nacos2.x部署并开启鉴权
本文介绍了使用docker-compose部署Nacos 2.0.4并开启鉴权的方法。通过配置docker-compose.yml文件,设置NACOS_AUTH_ENABLE=true及账户密码,同时支持MySQL持久化存储。文章详细说明了环境变量配置、容器部署参数,并针对配置迁移和客户端更新问题提供了解决方案:包括数据同步、模拟变更通知等。还特别指出直接修改数据库而不触发发布流程会导致配置不生效的问题,建议通过API或界面操作确保配置同步到内存缓存。最后提供了Nacos社区群联系方式以供进一步交流。
2025-07-20 03:30:00
876
原创 deepseek r1满血版性能监控+告警
本文详细介绍了如何部署和监控deepseekr1模型。首先,通过下载模型、安装vllm并使用vllm部署deepseekr1,完成模型的安装和启动。接着,通过Prometheus进行监控配置,并利用Grafana进行可视化展示。此外,还设置了Prometheus的告警规则,包括文件描述符告警和GPU缓存压力告警,以确保系统稳定运行。最后,通过alertmanager和PrometheusAlert结合企业微信机器人实现告警通知,确保问题能够及时被发现和处理。整个过程涵盖了从模型部署到监控告警的完整流程,为系
2025-05-16 02:30:00
599
原创 爬虫介绍与环境准备
安装比较简单,一般有两种方式,一种就是python环境,另外一种就是Anaconda环境;方式一:Python 环境下安装安装 Python。安装 pip。pip 是 Python 的包管理工具,用于安装和管理 Python 包。如果 pip 已经安装则会输出 pip 的版本信息,否则需要手动安装。安装 Jupyter Notebook。使用 pip 命令来安装 Jupyter Notebook。等待一段时间,Jupyter Notebook 就会被安装到你的电脑上了。
2025-05-11 03:00:00
713
1
原创 mybatis-plus集成dm,分页插件不生效
一、问题产生集成dm,兼容kingbase后,切换数据源dm,发现分页插件不生效二、问题分析通过查看源码,发现MyBatis-Plus分页插件通过属性确定数据库类型,动态生成符合目标数据库的分页语法。其底层实现依赖以下核心机制:插件内部维护静态注册表,存储所有支持的数据库类型(如DbType.DM)与对应IDialect接口实现的映射关系。分页拦截器(如)通过从注册表获取IDialect实例,调用其方法对原始SQL进行分页语法改造。
2025-05-10 03:00:00
2082
原创 k8s命令大全
应用自定义资源定义(CRD)文件,创建新的资源类型。:列出所有已定义的自定义资源。:查看特定自定义资源的实例列表,其中是CRD定义中的plural字段值。kubectl create cronjob [name] --image=[image] --schedule="[cron expression]:创建CronJob资源,用于按指定计划运行容器。kubectl get cronjobs :查看集群中所有的CronJob资源。kubectl describe cronjob [name] :查看
2025-05-07 03:00:00
1827
原创 docker使用汇总
显示Docker容器和物理主机挂载目录信息docker inspect -f "{{.Mounts}}" ContainerID将主机的/home/data目录挂载到容器的/data目录下:docker run -d -v /host/ --name busyboxtest busyboxdata:/data日志查看docker logs 容器id查看docker根目录结构du -sh /var/lib/docker/*
2025-04-04 03:00:00
756
1
原创 mysql blob类型报Data too long for column
Cause: com.mysql.cj.jdbc.exceptions.MysqlDataTruncation: Data truncation: Data too long for column 'template_content' at row 1; Data truncation: Data too long for column 'template_content' at row 1当字段类型已设为但仍出现错误时,主要原因为:
2025-04-02 02:00:00
646
原创 执行shell脚本出错:No such file or directoryc/sys/vm/drop_caches
,在 Linux 中被识别为。有可能是由于编码问题导致的。说明文件格式需要转换。脚本文件可能包含 。,导致路径被截断。
2025-03-24 00:30:00
282
原创 feign配置重试次数不生效
上述调用完后,发现不对,配置了3次,实际重试了6次,注册中心有2个被调服务实例。,当服务注册多个实例时,Ribbon 会在首次请求失败后 。当两个服务实例注册到 Eureka 时,Ribbon 的。您的重试次数异常(配置3次实际触发6次)是由于 。修改完成后,再次执行程序,控制台输出了超时。可以看到文件服务重试了3次,如下图所示。自定义重试次数,实现如下。,导致每个实例被调用。(默认)、Feign。
2025-03-16 22:25:01
593
原创 三步搞定本地部署deepseek R1模型,不联网也可以流畅使用
验证安装:打开浏览器,访问http://localhost:3000,如果看到Ollama的界面,则表示安装成功。在ollama官网,点击models选项,选择deepseek r1,因为是个人电脑,本身电脑配置就不高,安装Docker:根据操作系统,从Docker官网下载并安装Docker。命令,如果显示Ollama相关的信息,则证明安装已经成功。:下载完成后,双击运行安装包,并按照提示完成安装。:下载完成后,双击运行安装包,并按照提示完成安装。:安装完成后,打开命令提示符(cmd)窗口,输入。
2025-03-09 22:14:38
1123
原创 kingbase读取blob,下载文件注意事项
在业务输出的时候,判断是否是人大金仓数据库,如果是人大金仓数据库,就进行转换,如果不是人大金仓就走原先的流程。由于人大金仓存储的blob是16进制,且前后前后还包含了0字节。导致我们原先下载文件的方法有异常。DbUtils.java 转换方法提取到公共包。
2024-08-31 21:57:05
745
原创 ElasticSearch添加xpack认证
要重新申明es client,重新初始化TransportClient 以及ElasticsearchTemplate。说明:如果不需要xpcak认证,则只需要将设置。application.yml 配置。三、es整合xpack实现。其他代码保持不变即可。一、新增xpack依赖包。二、 在其他工程中引用。然后 进入工程 执行。
2024-08-31 21:26:15
967
原创 Job定时任务不允许并行&错过(misfire)策略说明
将所有错过的执行时间点全都补上,例如,任务15s执行一次,执行的任务错过了4分钟,则执行MisFire时,一次性执行4*(60/15)=16次任务。任务完成后,如果下次触发时间为null,则状态变更为COMPLETE,如果下次触发任务不为nul。列,对quartz而言,就已经调度完成了,后续任务的执行状态无法跟追,导致原生注解@Disa。l,则状态变更为WAITING,进入等待下一次任务的触发。当任务执行时间过长、服务停机、任务暂停等原因,导致其超过其下次执行的时间点时,就。
2024-08-08 15:36:21
1821
原创 控制某些请求不记录日志
LogPermission(print=false,write=false) //不允许日志存储,也不允许日志输出到控制台。:由于统一拦截日志请求,导致所有匹配的请求都会打印日志,这里需要控制有些请求执行不打印日志,比如定时每隔几秒执行某些请求。@LogPermission(print=false) //不允许日志输出到控制台,但允许日志存储。@LogPermission(write=false) //不允许日志存储,但允许日志输出到控制台。可以根据业务需要,在不需要日志记录的地方,添加下列注解。
2024-08-08 15:01:27
545
原创 mysql JSON特性优化
由于一些特定场景,mysql需要用到json串,例如文档,不同的文档可能包含的属性不一样,且属性个数较多,这个时候用json存储比较合适,不然用宽表,影响性能,维护也麻烦(例如后期新增属性之类的)有朋友问到,mysql如果要根据json中的某个属性过滤,数据量大的话,性能很差,要如何提高性能?后面可以为这个虚拟列创建索引,根据虚拟列来过滤即可。这里可以根据mysql5.7引入的虚拟列来解决。创建表test,包含如下数据。好了,不废话,直接上方案。(全表扫描,效率低)
2024-07-22 20:55:12
767
数据库管理-KingbaseES/KStudio图形化工具-管理工具-数据库连接管理
2025-03-22
机器学习 - K-means聚类核心原理与Python实战 +数据集 - 算法工程师必备(附demo)
2025-03-16
机器学习 - 线性回归算法原理与Python实战案例 - PDF+代码+数据集 - 数据科学入门必看(汽车价格预测)
2025-03-16
RabbitMQ用户手册
2014-10-12
classic-cache-killer-2.1.crx
2020-03-29
磁盘调度算法(最短寻道时间优先算法(SSTF) 扫描算法(SCAN) 先来先服务算法(FCFS) 循环扫描算法(CSCAN)....)
2010-04-30
freemarker教程_中文版
2012-07-04
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅