- 博客(182)
- 资源 (9)
- 收藏
- 关注
原创 基于n8n指定网页自动抓取解析入库工作流实战
第一节点用于 接收聊天输入第二个节点用于判断是否为链接:我们可以直接拖动chatInput到蓝色字体处,然后选择正则表达式匹配url。
2025-06-08 20:27:21
295
原创 Ubuntu 22 升级 Chrome 后不兼容搜狗拼音输入法解决方案
【代码】Ubuntu 22 升级 Chrome 后不兼容搜狗拼音输入法解决方案。
2025-06-07 17:03:35
226
原创 任务中心示例及浏览器强制高效下载实践
这里的进度展示,可以通过我们之前讲到的SSE技术实现,比如用户点击全量下载时,后台需要将PDF文件打包为ZIP文件,由于量较大,需要展示进度,用户点击全量下载后后可到任务中心查看进度。对于任务中心的下载我们如果用浏览器自带下载功能,可以如下。
2025-05-31 10:12:43
355
原创 SpringCloud+Vue实现大文件分片下载(支持开始、暂停、继续、取消)
spring:cloud:openfeign:client:config:default:connectTimeout: 5000 # 5秒连接超时readTimeout: 30000 # 30秒读取超时download: # 下载服务专用配置connectTimeout: 30000 # 连接超时30秒readTimeout: 3600000 # 读取超时60分钟(1小时)@Slf4j@Component@Override// 允许跨域。
2025-05-20 22:24:00
597
原创 基于扣子实现工作流与插件及本地服务调用
"""Return:"""data = {"Authorization":"Bearer 授权token",return {}
2025-05-18 10:31:59
376
原创 Airflow全局异常捕获实现消息通知实践
之前我们有讲到如何基于Helm部署Airflow, 为了实现定时任务异常实时捕获通知,我们改造values.yaml文件, 主要是覆盖/opt/airflow/config/airflow_local_settings.py文件。
2025-04-23 22:15:59
255
原创 记一次Utuntu装完无法联网问题
有幸参与了一次机柜撤离行动,由于部分机器太老,我们决定下架一个机柜,12台机器, 把相关的服务停止或者迁移完毕后,抵达机房开始行动。有6台新机器需要做系统,我们选择Ubuntu24 LTS首先Ctrl + R进入格式化页面,进行格式化磁盘及新建分区;接着用U盘F11重装系统,修改镜像源为https://mirrors.aliyun.com/utuntu当然要选择挂载的路径如/home,否则1T的硬盘空间不识别,通过df -h 查看;配置网络情况,我没配置无脑下一步,导致无法上网。
2025-04-19 10:01:46
283
原创 2.5亿企业库数据解析入库
上次我们训练了简单的中文分词模型,效果不是太好,后面转向Bert+CRF中文分词研究,有了这么多真实地址进行测试验证,相信很快就会有结果,第一时间开源给大家。
2025-04-12 12:56:14
312
原创 基于NebulaGraph构建省市区乡镇街道知识图谱(二)
上次我们有讲到构建知识图谱,但是在实际使用的时候会发现某些乡镇街道丢失的问题,因为VID必须全局唯一,覆盖导致原因,另外在全国大批量导入时速度非常慢,为此,我们重新优化表结构与导入语法。
2025-04-02 21:17:53
197
原创 线程安全与任务执行解耦跑批及消息实时通知实践
目前在跑批任务中,有多种类型,存在很多冗余代码,且发现任务跑批后数据丢失或者卡死问题,故进行优化改造。
2025-03-22 14:03:56
125
原创 解决K8S多实例AI回答消息丢失及错乱问题
发布到生产环境[K8S server端服务2个pod, web端1个pod]后我们询问AI,发现AI回答卡死,查看日志是因为多实例问题导致SseEmitter异常:No emitter found for client。
2025-03-16 15:58:03
182
原创 基于Grok3+NebulaGraph构建省市区乡镇街道知识图谱
实体类型:Province(省份)、City(城市)、District(区域)、Street(乡镇街道)。每个标签可以附加属性,例如名称。关系类型:hasPart(包含)、partOf(属于)。边可以附加属性。
2025-02-25 21:05:45
394
原创 SSE部署后无法连接问题解决
通过域名访问 https://api-uat.sfxs.com/sse/subscribe?一直无法正常连接。
2025-01-14 20:20:31
1056
1
原创 论软件可靠性设计及其应用
在智慧营销子系统中,加油站通常会和合作商家联手开展个性化的营销活动,以此提高用户的忠诚度和复购率,一种常见的合作形式是用户在智慧加油站平台中参与营销活动后所获得的奖励需要通过合作商家提供的开放的 API 接口进行兑换。我们收到告警信息后,通过查看 Grafana 的可视化实时监控图表发现某个工作节点的磁盘使用率达到了 100%,然后我们对该工作节点进行了进一步的排查,发现了问题源头在于该工作节点的磁盘被大量日志文件占满了,这导致积分服务无法正常提供服务。通过以上三种技术,我们有效地提升了系统的可靠性。
2024-11-09 20:30:07
1184
1
原创 Nebula图数据库常用 nGQL命令
一个 NebulaGraph 实例由一个或多个图空间组成。每个图空间都是物理隔离的,用户可以在同一个实例中使用不同的图空间存储不同的数据集。为了在图空间中插入数据,需要为图数据库定义一个 Schema。NebulaGraph 的 Schema 是由如下几部分组成。在 NebulaGraph 中,下列创建和修改操作是异步实现的。要在下一个心跳周期之后才能生效,否则访问会报错。为确保数据同步,后续操作能顺利进行,请等待 2 个心跳周期(20 秒)。
2024-08-11 17:32:44
723
原创 解决JDK17 java.lang.UnsatisfiedLinkError: /opt/jdk17/lib/libfontmanager.so: libfreetype.so.6
本地开发EasyExcel导出无问题,K8S发布后导出报错。
2024-08-09 21:16:18
1217
原创 1.4亿中文知识图谱导入Nebula Graph快速体验
Yener 开源了史上最大规模的中文知识图谱—— OwnThink(链接:,数据量为 1.4 亿条。数据以 (实体, 属性, 值) 和 (实体, 关系, 实体) 混合的三元组形式存储,数据格式为 csv。
2024-08-03 22:21:10
614
原创 Vue项目发布后浏览器缓存问题解决
每次Jenkins自动化发布Vue项目后,用户需要手动全部清理历史缓存数据才可以使用系统,用户体验非常不好。
2024-07-27 10:28:51
4518
1
原创 全栈工程师工作干货总结(二)
我买的是腾讯云的服务器Cenos 6.5系统,自己配置的DNS域名服务器,nslookup www.xuefeng66.cn能够正常解析为115.159.201.119(若是非权威解析为该结果证明解析还存在问题,需要更改/etc/resolv.conf中的服务器地址,添加你买的域名服务器地址),解析成功后,发现通过IP可以访问,但是通过域名不能访问,终于发现时tomcat的问题。
2024-06-22 11:35:44
328
原创 12.SpringBoot3连接MongoDB多数据源
本文实践MongoDB多数据源连接,目前服务器版本分别为4及3.2,所以需要兼容这两种版本,在选择依赖包时需特别注意MongoDB版本。
2024-06-15 08:18:01
683
1
原创 系统架构师英文题目
软件架构重建是一个解释性的、交互式的、迭代的过程,包括许多活动。(信息提取)涉及分析系统的现有设计和实现工件以构建其模型。结果用于以下活动以构建系统视图。数据库构建活动将视图中包含的(元素和关系)转换为标准格式以存储在数据库中。(视图融合)活动涉及定义和操作数据库中存储的信息,以协调、扩充和建立元素之间的连接。重构包括两个主要活动:(可视化和交互)和(模式定义和识别)。前者为用户提供了操纵架构元素的机制,后者为架构重建提供了便利。
2024-05-03 11:47:26
581
原创 AI文本生图模型Stable Diffusion部分模型叠加效果
兄弟们,最近有个烦恼,就是找图有点费事,干脆自己部署个文本生图模型Stable Diffusion,虽然机器性能慢,但是效果还可以,先和大家截图分享下,后面将映射ai.shenjian.online供大家免费使用。
2024-01-14 08:22:50
1104
原创 3.OpenResty系列之深入理解
对于 MySQL ,可以调用 ndk.set_var.set_quote_sql_str ,进行一次过滤即可,如果恰巧你使用的是 PostgreSQL ,调用 ndk.set_var.set_quote_pgsql_str 过滤输入变量。在发起子请求前,用户程序应总是读取完整的 HTTP 请求体 (通过调用 ngx.req.read_body 或设置 lua_need_request_body 指令为 on).Nginx 子请求是一种非常强有力的方式,它可以发起非阻塞的内部请求访问目标 location。
2024-01-07 10:28:52
1344
Socket实现两台计算机间的简单通信
2016-11-05
绿色PDF转换器
2016-11-08
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人