- 博客(162)
- 资源 (2)
- 收藏
- 关注
原创 MCP前后端技术研究和应用实践
最近在结合agent应用开发的过程中,对MCP进行了一些研究。MCP主要涉及到服务端和客户端,客户端可以自己基于mcp.client编写,大部分情况下不用自己编写,有很多现成的client,比如在vscode中的cline,基于nodejs的inspector等等,本次主要研究如何实现MCP服务器,如何用inspector客户端调用mcp服务,如何自己编写一个简易的mcp client等等
2025-06-14 21:37:55
97
原创 如何在Redhat Linux7.9下安装配置MySQL
在做后端开发过程中,经常需要访问数据库,之前都在在windows环境下大家mysql环境,相对容易一些,linux环境下的mysql数据库配置有些复杂,我参考了一大堆资料,有些细致,有些略,为了后续自己在其他新服务器下的快速配置,也为给大家一个完整的配置过程,特意编写了如何在Redhat Linux7.9安装配置Mysql,包括如何下载,建立用户,设置权限,初始化,配置,服务注册启动和远程用户访问权限设置等等
2025-06-08 11:23:46
905
原创 基于Dify实现各类报告文章的智能化辅助阅读
大家在日常工作中经常需要阅读或审核各类报告、纪要、文章等材料,但经常由于时间有限,无法完整的阅读全文,因此就需要类似于秘书或者助手角色来帮助整理出报告的主要内容,观点和支撑信息等,这些需求恰恰是目前AI大模型的强项,因此本次就基于dify的工作流实现单个报告材料的智能化辅助阅读,支持pdf、word、txt、csv等,能够实现各类报告、文章的总体结构内容的自动阅读总结,同时根据内容提出针对性、有深度的问题供参考。
2025-06-01 11:26:14
54
原创 培训总结--保持宏观视野践行科技创新驱动企业高质量发展
最近参加了一项重点领域方面的集中培训,培训内容丰富而深入,从国家战略层面到具体技术应用,再到企业文化和应用实践,为我们搭建了一个全面而立体的学习框架。通过系统学习,我们不仅拓宽了视野,更深化了对当前国家和行业发展趋势的理解,为未来的工作实践注入了新的思考与动力。主要有如下五点总结,供大家参考。
2025-05-25 22:18:22
323
原创 Linux中如何通过iptables实现端口访问控制
对于docker部署应用的访问控制,只能采用iptables访问过滤来实现访问控制,因为docker默认会绕过firewalld防火墙。Iptables是配置 Netfilter 过滤功能的用户空间工具。 netfilter 才是防火墙真正的安全框架(framework),netfilter 位于内核空间。iptables 其实是一个命令行工具,位于用户空间,我们用这个工具操作真正的框架。Iptable 根据规则所定义的方法来处理数据包,如放行(accept)、拒绝(reject)和丢弃(drop)等。
2025-05-18 22:40:11
482
原创 利用仓颉语言实现一个正整数中数字出现的频次统计
利用仓颉编程语言实现如何统计一个正整数中各个数字出现的次数的小应用。目前看仓颉可供参考的资料还是偏少,只能看官方的开发指南或sdk,详见华为官方文档,目前用各类搜索引擎或者deepseek等大模型搜索,回复基本都将其认为是一种输入法,查找内容都不理想。因此,本次就参考官网sdk进行了实现,其实实现原理很简单,如果用python、java等语言实现非常容易,整体思路就是采用除法取余方式计算每一位的数字是几并进行对应十个位置的存储记录和累积,最后输出即可。
2025-05-11 18:10:05
379
原创 基于Dify实现对Excel的数据分析
在dify部署完成后,大家就可以基于此进行各种应用场景建设,目前dify支持聊天助手(包括对话工作流)、工作流、agent等模式的场景建设,我们在日常工作中经常会遇到各种各样的数据清洗、格式转换处理、数据统计成图等数据分析工作,本次主要基于对话工作流模式对Excel文件、csv文件进行解析处理,并进行成图等数据分析工作。主要用到的插件有LLM节点,文档提取器、参数提取器、自定义代码节点、echart插件等。实现解析Excel数据,经过上述不同节点的处理分析流程,最终实现数据统计图展示。
2025-05-11 17:39:27
1883
2
原创 林业数智化转型初步设计方案
林业方面主要有三大方向,即林业生态、生物灾害和疫源疫病,目前已经建成了一些信息化系统,但在数字化智能化方面偏弱,就想着如何借助人工智能、物联网、大数据和数字孪生等数字化技术来推动林业业务的转型发展,所以就编写该方案,主要包括项目背景、目标、核心任务、实施路径和资源投入情况,同时对用到的主要核心技术模块进行了梳理设计。
2025-05-05 18:45:53
97
原创 读书笔记--华为从偶然到必然之创新与技术开发阅读有感
华为在创新与技术研发方面有体系化、系统化和延续性。创新是企业的生命线,是企业发展的不竭动力,同时将企业文化与创新精神进行了融合,华为的企业文化强调以客户为中心、以奋斗者为本、长期艰苦奋斗、坚持自我批判,"以客户为中心"不仅是口号,更是技术创新的北斗导航,始终认为企业存在的理由在于满足客户需求,为客户创造价值,华为的创新就是紧紧围绕客户需求进行的,创新有确定性创新和不确定性创新,前者由产品线负责,后者由各类实验室或研究院负责,华为鼓励创新、宽容失败。
2025-04-28 08:24:48
778
原创 Dify部署内网时遇到的代理问题及解决办法
基于dify开发agent、workflow等非常方便,本次想着在内部网络环境下也完成部署,以方便更多的人实验,但在部署到内网环境下,遇到各类问题,虽然可以通过离线下载安装包来解决,但是总会遇到各种各样的问题,因此本文做了如何通过代理实现安装和更新,具体如下,在dify镜像安装在企业内网部署时,需要考虑各种情况下的代理问题。
2025-04-20 17:13:55
834
原创 读书笔记--华为从偶然到必然之研发能力及管理经验阅读有感
华为在研发能力及管理方面有自身独特的研发方法论,具体包括通过业务分层与异步开发进行复杂业务层级的解耦,通过架构与设计进一步解耦形成产品级可复用的公共平台及一系列复用组件,借助公共平台落地架构设计,沉淀能力,积累打造公共基础模块及优选器件库,通过一系列的技术积累和方法创新,极大了方便了各研发团队的协同和项目管理,减少软件重复开发,提升研发效率,快速开发有竞争力的算法,提升产品的竞争力,打造了多支具备快速反应和构建敏捷工程能力团队。通过学习能够让我们感觉到华为的成功绝对不是偶然,是多年研发能力的积累。
2025-04-13 14:40:39
551
原创 Nginx负载均衡时如何为指定ip配置固定服务器
大家在用Nginx做负载均衡时,一般是采用默认的weight权重指定或默认的平均分配实现后端服务器的路由,还有一种做法是通过ip_hash来自动计算进行后端服务器的路由,但最近遇到一个问题,就是希望大部分用户采用ip_hash自动分配后端服务器的同时,如何将指定ip或ip段访问指向指定后端服务器?本文主要利用Nginx的upstream模块的ip_hash实现负载均衡,同时结合geo模块,通过ip_hash、default来实现上述需求,具体配置情况如下,供大家参考,记得重启nginx,即可实现配置调整。
2025-04-06 22:01:46
530
原创 利用Dify构建文档内容的分析对比
本次主要做了一些workflow和Agent的应用实现,供大家参考。主要目的是为了进行两个内部报告文件的内容对比,特别是报告中的各类审批表、申请表、推荐表和流程对比,本地数据通过知识库方式分别加载到两个知识库中,编制工作流针对同一个问题进行知识库检索,之后将查询结果进行合并,再一起提交给LLM进行对比,最终将对比分析结果以markdown方式返回显示。主要包括如何构建知识库,如何设计workflow、如何将工作流发布为工具、如何设计提示词、如何在agent中引入前面发布的工具,最终通过agent实现与用户交
2025-03-30 17:20:23
779
原创 利用Dify编制用户问题意图识别和规范化回复
整体感觉dify在工作流可视化编排方面非常好,部分功能无法实现,可以通过代码执行模块或者自定义工具来实现(后续再具体分享),agent方面也有提示词引入、变量定义、知识库引入和工具引入等,同时支持多轮对话,总体感觉workflow和agent结合着用非常方便,供大家参考。本次要是在游泳健身方面实现了用户提出的有关游泳健身方面问题意图识别、分类,包括有关游泳健身和健身app使用方面的咨询,最终形成规范化问题反馈输出,这里设计到如何构建知识库,如何设计workflow、如何将工作流发布为工具等等。
2025-03-22 21:53:26
2534
原创 Dify使用部署与应用实践
最近在研究AI Agent,发现大家都在用Dify,但Dify部署起来总是面临各种问题,而且我在部署和应用测试过程中也都遇到了,因此记录如下,供大家参考。Dify总体来说比较灵活,扩展性比较强,适合基于它做智能聊天机器人,文本生成,工作流任务,Agent应用建设等场景,要比其他客户端工具更加灵活,更加适合二次开发,但Dify部署起来非常麻烦,会自动部署10个容器,任何一个出现问题,应用都无法正常使用。后续我会与Autogen对比,看看在Agent方面哪个更适合垂直行业AI应用的快速落地。
2025-03-16 19:16:15
3660
2
原创 Manus+Ollama实现本地大模型部署和应用测试
Manus的确是一个可以进行任务分解的自动化解决方案,将其他AI需要多次繁杂的迭代对话做了较大的改进,相当于用户抛出一个问题或者关注的主题/任务,剩余工作让Manus自己找素材、找资料、找工具,进行汇总润色测试和验证,最后为用户提供的最终成果,目前测试的中间步骤用户是无法介入的,或者通过用户在提需求时利用约束进行引导,同时,目前只能支持网页和python execute等方式,其他方式还不支持,后续AI在应用场景落地过程中,各个环节都需要具体问题具体分析,进行不同程度的创新,希望后续Manus支持国内各大搜
2025-03-08 18:19:13
1518
4
原创 Linux服务器防火墙白名单访问策略的配置示例
最近在做Linux系统应用部署配置过程中,为了确保应用的安全,简单学习了解了一些Linux中的动态防火墙管理工具的使用方法。本文测试实验主要采用Linux服务器的动态防火墙管理工具(即firewalld),来实现服务或端口的访问控制,firewalld主要用于管理 Linux 系统中的防火墙规则,firewalld不是一个独立的防火墙软件,他基于 Linux 内核的netfilter框架的前端工具,firewalld 适用于需要灵活管理防火墙规则的环境,例如服务器安全、网络隔离、服务访问控制等。
2025-03-01 19:29:15
579
原创 Open-WebUI前后端分离部署并基于DeepSeek实现智能问答
本文尝试将Open WebUI前后端进行分离,单独部署,目前已经实现了前后端分离,前端是src+static目录(编译完成后为build),后端是backend目录,后端需要运行在python环境,前端编译完成后部署到nginx运行即可,当然需要对源码很多地方进行修改,svelte脚手架类似于VUE、React,写法基本与VUE类似。
2025-02-22 22:39:23
636
原创 DeepSeek在linux下的安装部署与应用测试
本篇文章主要讲述在Redhat linux环境下如何部署和使用DeepSeek大模型,主要包括ollama的安装配置、大模型的加载和应用测试,关于Open WebUI在docker的安装部署,Open WebUI官网也提供了完整的docker部署说明,大家可参考github,但对于Open WebUI前后端分离的部署没有详细说明,这需要修改一部分前后端代码。
2025-02-16 21:19:18
1809
原创 DeepSeek技术跟踪和本地部署实践
DeepSeek是中国人在AI领域一次技术创新,甚至超越,给各大AI公司提供了一条全新的赛道,其推出的强化学习等技术提醒大家AI不单单是Transformer架构下的堆算力、堆数据,还需要在算法和工程落地方面的不断创新实践,下面具体来说说,供大家参考学习。DeepSeek(深度求索)是一家杭州地区量化私募巨头幻方量化旗下的AI公司,成立于2023年5月,专注于人工智能技术研发,致力于打造高性能、低成本的AI模型。目前发布的产品中最突出的是DeepSeek-V3 和 DeepSeek-R1。
2025-02-09 10:21:49
1069
原创 读书笔记--分布式架构的异步化和缓存技术原理及应用场景
本篇是在的基础上,主要对分布式应用架构下的异步化机制和缓存技术进行学习,主要记录和思考如下,供大家学习参考。大家知道原来传统的单一WAR应用中,由于所有数据都在同一个数据库中,因此事务问题一般借助数据库事务来解决,但是对于分布式架构下的应用系统来说,事务性问题就无法采用这种方式了,否则会出现数据库单点问题,而且随着应用范围和用户量的增大,需要通过分布式异步化机制来解决系统处理性能和吞吐率下降等问题。
2025-02-03 22:28:52
1253
原创 读书笔记--分布式服务架构对比及优势
随着企业各业务数字化转型工作的推进,之前在传统的单一系统(或单体应用)模式中,每个系统都要做这些公共的功能或模块,比如用户管理,权限认证,日志,邮件,财务等等,随着企业各大应用系统的不断扩展,各垂直业务板块逐步沉淀形成各自的核心业务的数字化能力,提出了基于SOA理念的分布式服务架构,SOA理念主要特性有面向服务的分布式计算、服务间松散耦合、支持服务的组装、服务注册、自动发现、以服务契约方式定义服务交互方式等,本文介绍的ESB、HSF及微服务都是基于SOA理念,只是处于不同的发展阶段和不同的应用场合。
2025-01-27 23:05:51
1450
原创 读书笔记--共享服务平台的建设思路和内外部协作模式
本篇是在的基础上,继续对共享服务中心依赖的共享服务平台的建设思路、考核指标、协作模式等展开进行学习思考,主要记录和思考如下,供大家学习参考。随着企业的信息化、数字化、智能化建设的推进,很多传统企业都在学习过去5-10年互联网企业已经历的共享服务中心(即各种中台)的建设思路,开始从原来传统烟囱式建设转变为平台/中台+技术+应用,比如阿里巴巴的共享服务中心,传统企业的统一share服务等等。
2025-01-19 10:44:56
582
原创 读书笔记--共享服务中心建设原则
随着企业的数字化转型推进,很多企业开始从原来的SPA模式应用转变为平台+技术+应用,比如阿里巴巴的共享服务中心,传统企业的统一认证的share服务等等。可以说,共享服务中心是各类中台架构的基石。沉淀了一系列建设原则。这里阐述的服务能力有两类,一个是底层的PaaS能力,用于解决分布式、可靠性、可用性、容错、监控及运维层面的通用需求;一个是业务能力,用于提供的核心业务支撑能力,支撑上层业务的敏捷、稳定和高效。
2025-01-12 22:20:44
234
原创 2024年工作总结
总体来说,2024年读书感悟有深度了,blog内容有深度有自己的特色了,技术方向明确了,也具体沉到技术内部了,比如做了基于大模型的智能问答,数字孪生方向带领团队有新的试点突破。整体来说,即将过去的一年工作和学习收获颇多,编写了55篇blog,158篇笔记,4篇paper,阅读10多本书,40余份报告等等。希望明年继续能够身心健康的投入到工作生活中,让自己在数字化素养、数智化技术、文学等方面有所进步,让自己持续在技术方面、认知方面和信息业务融合等方面都有所突破和积累。
2024-12-31 23:17:43
232
原创 有关多张图像的合并处理方法
最近在工作中经常遇到成果报告中的图片拆分合并等处理问题,由于报告中各类成果图都是几张图片的合并,只有合并组合后的图像才具备实际业务含义,因此需要将报告中获取的多张图片进行合并处理,最少两张,最多五张图片,相当于一张综合图由多张子图共同构成,所以就采用pillow实现图像的合并处理,主要支持接收字节流和图片文件路径两张方式,合并模式支持左下角,右下角等5中模式,主要目的是为后续的多模态大模型训练微调做准备。
2024-12-30 11:07:16
369
原创 读书笔记--数字孪生的应用价值和典型场景
数字孪生技术是未来实体产业的基石,是一项产品全生命周期管理的颠覆性技术,特别是未来工业革命的新生产要素。主要应用领域有制造业、建筑业、航空航天等15个社会工业领域。讲述的好多观点非常适合工业领域,特进行了摘录整理。部分内容加入了自己的一些实践思考或扩展,这一篇是在上一篇文章的基础进行的综合学习,主要回答了数字孪生的应用价值有哪些,应该从哪几个角度展开论述,数字孪生的典型应用场景有哪些,其实我认为数字孪生有大/整体的应用场景,比如智慧/智能城市的整体数字化调控,同时也有小/聚集的应用环节,特别是工业领域。
2024-12-22 11:09:52
1035
原创 Nginx配置示例教程
最近对Nginx做了一些初步研究,Nginx是lgor Sysoev为俄罗斯访问量第二的rambler.ru站点设计开发。主要根据工作中各类应用服务部署访问的需求,围绕HTTP服务、负载均衡、正反向代理、子路由、静态资源发布访问等,以及结合minio管理的图片文件资源预览,如何快速搭建web服务的一些研究和探索,也包括一些基本指令的解释和正则表达式等,主要编写了几个应用示例,其实Nginx应用范围非常广泛,功能都比较实用,任何一个功能都可以单独展开研究,比如关于性能优化的gzip功能,本文只是总结常见的应用
2024-12-15 16:49:37
1284
原创 如何利用DBeaver配置连接MongoDB和人大金仓数据库
我们已经习惯使用DBeaver连接各种成熟的商业或开源数据库,想着如何继续基于该工具,连接MongoDB和人大金仓数据库,查了半天很多地方说法不统一,所以自己就简单整理了一个如何利用DBeaver成功配置并连接这两类数据库,主要是配置信息如何编写,驱动库如何配置等。
2024-12-08 17:27:26
3758
原创 如何基于assimp实现三维模型格式转换
在的基础上,作为其补充,本篇主要阐述如何基于assimp来实现三维模型格式转换,包括assimp源码编译、二进制包直接命令行模式,以及基于pyassimp实现结合动态链接库进行模型转换,命令行模式下支持的文件转换格式偏少,主要包括obj/stl/stlb/ply/collada等,详见下方的formatTransF41代码,基于pyassimp的模型转换支持的主要格式包括obj/fbx/gltf/glb/ply/stl/collada等,供参考使用。
2024-12-01 17:10:33
301
2
原创 常见三维模型格式转换方案及服务设计实现
最近正在开展工业三维模型解析和可视化技术跟踪研究学习,结合各类工业三维模型文件格式情况,为了后续的三维模型规范化、解析处理和渲染显示的需要,主要基于Blender、assimp、trimesh、vtk等框架实现三维模型格式转换,部分模型通过转换实现了轻量化。目前支持常用的三维模型格式,比如支obj/fbx/gltf/glb/stl/ply等。
2024-11-23 11:23:31
363
原创 如何基于Tesseract实现图片的文本识别
如何将报告图片中的文本解析出来,最近研究了基于Tesseract的OCR方案,Tesseract OCR是一个开源的OCR引擎,主要结合开源的tesseract和pytesseract,实现了jpg/png等格式图片文本识别,供大家参考。
2024-11-16 21:47:01
471
原创 如何基于redis记录调用大模型问答的统一注册服务
在做各种大模型chat和应用后台服务过程中,需要记录不同应用、不同类型问题的调用情况,同时要求这种记录要快速便捷,因此就想到用redis来做统一记录,目前是同步调用方式,后续有空提供异步调用方式,从而实现不同后端服务的调用情况记录,以便后续做问题归类、频次、高峰分析等,详见第四部分的核心代码。实现了GET方式的新增key,获取key值;实现了POST方式的新增questions,获取questions值,json格式,这种方式相对全面。
2024-11-10 10:45:53
191
原创 如何基于pdf2image实现pdf批量转换为图片
最近为了将pdf报告解析成为文本和图片,需要将大量多页的pdf文件拆分下单独的一页一页的图像,以便后续进行OCR和图像处理,因此就需要实现将pdf2image,就结合开源的pdf2image和poppler,简单实现了pdf转换为png图片格式的转换工具
2024-11-03 22:39:01
711
原创 LibreTranslate的本地部署与应用服务开发
一个开源翻译方案(即LibreTranslate),对于通用和计算机类内容的翻译效果还是不错的,因此就对开源翻译代码进行了本地部署和应用服务开发及测试。主要对源码的启动参数、api服务、认证服务和访问权限等内容进行了补充完善,并将依赖的翻译argos-translate包进行了本地配置,还有流量ip限制等。
2024-10-26 12:07:23
723
原创 基于curl和wget命令编写的多文件或大文件批量上传下载
最近需要在windows和服务器linux系统之间传递大量的文件,部分文件非常大(TB以上),并且文件夹中包含文件或文件夹,需要先进行上传再进行组织,因此就想办法结合curl和wget命令编写了命令或脚本工具,供大家参考学习。本文主要实现了单文件上传下载,多文件/嵌套文件夹上传下载,如果需要续传,记得加上-C参数。
2024-10-19 12:51:22
644
原创 开源视觉大模型的部署与应用测试实验
继去年的基础上,根据对文本生成大模型的研究,基本上实现了本地部署,应用服务设计实现,文本大模型微调等工作。最近结合实际需求,开展了图像识别,特别是图像生成文本,图像整体描述,图像要素描述,图像属性描述,多张图像对比和图像文字识别等等,本文结合目前已开源的三类视觉大模型进行部署实现,实现顺序是先做托管的终端服务,以方便程序调试使用,其次做api服务,方便其他系统或工具调用或联调使用,最后提供web工具,方便用户实际测试使用。目前已支持Llama-3.2-Vision、glm-4v和Qwen2-VL视觉大模型。
2024-10-13 11:35:08
394
原创 读书笔记--阅读额尔古纳河右岸的记录与总结思考
讲述了这个鄂温克族百年来的沧桑巨变和生死传奇,应该说这是一部展现这个少数民族顽强生命力和不屈不挠精神的作品,也深刻地揭示了人类特别是鄂温克族人在人类历史进程中的沧桑巨变和悲哀,究竟现在社会的是进步了还是退步了,对于过去的这些传统文化沉淀积累其实是一种遗失,正因为现在社会的变化太快了太过追求现实,但鄂温克族人的以下这些特质值得我们去深入探讨,否则再过300年,我们能够为后代社会留下什么物质和精神品质呢,可以说读到最后能够感觉到小说不仅是对一个民族的挽歌,也是对人类与自然关系的深刻反思。
2024-10-05 12:46:01
1022
原创 读书笔记--结合自身经历和乡土中国的阅读总结思考
我自己其实和董宇辉非常类似(当然和他比差远了,我的知识储备、思考感悟、远见创新等方面远远不及董老师),我也是一个生在长在农村的一位乡土气息特别浓、受乡土性培育深远的乡下人。
2024-09-28 12:49:01
817
原创 Langchain-chatchat源码部署及测试实验
Langchain-chatchat从0.3版本开始,支持更多的部署框架,如xinference、Ollama和FastChat,较多的是xinference框架,因此本文也是基于该框架进行模型部署。开始时参考了作者提供的开发指南进行部署,感觉步骤较多且麻烦,因此我就采用直接修改源码方式进行部署,作者提供的前端没有用,主要使用的是libs下面的后端接口和默认基于Streamlit提供的前端测试功能。另外,我更新完善了本地知识库加载的多种文件格式解析模块,增加了验证和路由过滤模块、返回数据格式等。
2024-09-20 17:54:48
527
LibreTranslate之argos-translate-packages离线包-附加包
2024-10-20
LibreTranslate之argos-translate-packages离线包
2024-10-20
CDGP真题解析,包含了2023年1月-2023年9月真题,供大家学习参考
2024-07-16
nltk-data语料库和模型资源
2022-11-05
单页Web应用:JavaScript前端到后端--源代码
2016-06-11
scipy手动安装包
2017-09-24
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人