- 博客(60)
- 收藏
- 关注
原创 【模型部署】triton部署tensorrt报错:UNAVAILABLE: Internal: unable to load plan file to auto complete config:
trtion server镜像的tensorRT, 与你将onnx等格式转换为tensorRT的版本不一致。
2025-05-22 14:29:43
56
原创 【软件设计师】知识点简单整理
定义对象之间的一对多依赖关系,当一个对象状态改变时,所有依赖对象都会收到通知并自动更新。适用于需要同步更新多个对象的状态的场景。适用于有多种实现方式且需要灵活切换的场景,如日志记录可以选择写入数据库或文件。:定义一个算法的框架,允许子类重定义某些步骤而不改变算法的结构。适用于需要定义算法框架并提供钩子方法让子类实现的场景。:提供一个创建对象的接口,让子类决定实例化哪个类。适用于需要动态创建对象的场景,如物流系统中的不同运输方式。适用于需要遍历复杂数据结构的场景,如STL容器。
2025-05-21 10:55:13
329
原创 【python】pyenv安装
本文介绍了如何在CentOS系统上使用pyenv工具管理和安装不同版本的Python。首先,通过curl命令安装pyenv,并配置国内镜像源以加速下载。接着,安装必要的开发工具和依赖库,并使用pyenv安装指定版本的Python。文章还详细说明了如何创建、激活、反激活和删除虚拟环境,以及如何为特定目录启用或去除虚拟环境。最后,提供了使用国内镜像源加速pip安装的方法。通过这些步骤,用户可以轻松管理多个Python版本和虚拟环境。
2025-05-19 14:38:25
191
原创 【软件设计师】模拟题六
以下是10道软件设计师考试题目,涵盖软件工程、算法设计、系统架构等核心知识点:A) 属于结构型设计模式B) 通过子类决定创建哪个对象C) 主要用于替代new操作符D) 会暴露对象创建细节A) 拓扑排序问题B) 具有最优子结构的问题C) 多项式时间可验证的问题D) 深度优先遍历问题A) 事务执行前后数据完整性不变B) 事务执行中间结果对其他事务不可见C) 事务要么全部完成要么全部回滚D) 多个事务并发执行结果与串行执行一致。
2025-05-15 16:25:39
322
原创 【软件设计师】模拟题五
A) 一致性(Consistency)或可用性(Availability)B) 分区容忍性(Partition Tolerance)C) 主干分支(master/main)必须始终可部署。A) 将对象组合成树形结构以表示“部分-整体”层次。D) 状态模式用于算法替换,策略模式用于状态管理。A) 状态模式的行为随对象内部状态自动切换。B) 策略模式需要客户端显式切换策略。B) 组件通过事件发布/订阅解耦。B) 动态地为对象添加额外职责。B) 通过继承或组合扩展功能。A) 修改已有类实现新功能。
2025-05-15 16:24:56
925
原创 【AI】mcp server本质就是一个接口服务么
以下为元宝的回答:你的理解非常准确!本质上是一个接口服务,但其设计目标、交互逻辑和使用场景与传统后端接口存在显著差异。
2025-05-12 17:30:24
1170
原创 【AI】mcp server是什么玩意儿
MCP Server是Anthropic公司于2024年提出的开源协议,旨在解决大语言模型(LLM)与外部系统(如数据库、API、文件等)的集成问题。它通过提供标准化访问接口、暴露可执行功能和动态通知,增强了LLM与外部工具的交互能力。MCP Server采用客户端-服务器架构,包含MCP Host、MCP Client和MCP Server三个核心组件,分别负责运行AI应用程序、管理通信和扩展LLM功能。MCP Server的出现解决了AI与真实世界交互的碎片化问题,其轻量级、安全性和模块化特性使其成为智
2025-05-12 17:22:02
418
原创 【软件设计师】模拟题四
以下是10道软件设计师考试题目,涵盖软件工程、算法设计、系统架构等核心知识点:A) 属于结构型设计模式B) 通过子类决定创建哪个对象C) 主要用于替代new操作符D) 会暴露对象创建细节A) 拓扑排序问题B) 具有最优子结构的问题C) 多项式时间可验证的问题D) 深度优先遍历问题A) 事务执行前后数据完整性不变B) 事务执行中间结果对其他事务不可见C) 事务要么全部完成要么全部回滚D) 多个事务并发执行结果与串行执行一致。
2025-05-12 10:16:07
323
原创 【软件设计师】模拟题三
:可重复读(Repeatable Read)隔离级别保证同一事务内多次读取结果一致,避免不可重复读;:ICMP(Internet Control Message Protocol)是网络层协议,用于传递控制消息(如ping命令)。:耦合度从低到高:数据耦合 < 标记耦合 < 控制耦合 < 公共耦合 < 内容耦合。:拓扑排序用于有向无环图(DAG),常见于编译过程的任务依赖分析。:数字证书由CA(证书颁发机构)签发,用于验证公钥所属者的真实身份,防止中间人攻击。A. 脏读(Dirty Read)
2025-04-25 17:29:07
476
原创 【软件设计师】模拟题二
:完全二叉树第5层有10个叶子节点,说明第5层是最后一层。前4层为满二叉树,节点数为 24−1=15,第5层最多有 24=16 个节点,但实际有10个叶子节点,因此总节点数最多为 15+16+10=41(注意题目描述可能存在歧义,此处按典型题型解答)。:GET参数在URL中,POST在请求体中;:链地址法通过链表存储冲突的哈希项,开放定址法、再哈希等也是解决冲突的方法,但选项C是直接相关答案。:螺旋模型通过风险分析指导迭代开发,适用于大型复杂项目,强调风险驱动而非单纯阶段性交付。
2025-04-25 09:33:10
830
原创 【go语言】window环境从源码编译go
早就听过go语言已经实现自举, 也就是使用旧版本go,来编译新版源码,得到新版本go。开发时尽量别用最新的go,vscode插件跟不上进度,容易卡住。可以看到得到了go1.25的开发版二进制程序。
2025-04-24 09:26:25
317
原创 【gpt生成-其二】以go语言为例,详细讲解 并发模型:线程/协程/ Actor 实现
线程是操作系统调度的最小单位,每个线程拥有独立的栈和寄存器上下文,但共享进程的内存空间。线程的创建、切换和同步需要较高的系统开销。通过以上内容,可以全面掌握Go语言中不同并发模型的实现与适用场景,灵活应对各类并发需求。Go语言不直接暴露OS线程,而是通过 。
2025-04-22 15:08:50
587
原创 【模型部署】使用onnxruntime部署rapidocr,提供fastapi接口
磁盘占用少。使用onnxruntime,cpu版本docker镜像几百MB磁盘占用。而paddlehub版本,我找过轻量级的镜像就得2GB,推理10多秒。推理速度快于paddlehub运行的api接口服务。
2025-04-22 14:50:03
1047
2
原创 【前端】跟着maxkb学习logicflow流程图画法
maxkb采用vue3 + ts + logicflow2实现上面的界面,我们选择vue2 + js跟着学。而配置开始节点的属性字段、通过表单录入的逻辑则是在startNode/index.vue中编写。我们绘制一个demo级别的开始节点,通过logicflow2。可以看到很简陋,那么我们尝试自定义节点样式。看看前端如何绘制流程图,界面好看点。
2025-04-17 17:03:10
283
原创 【gpt生成-其一】以go语言为例,详细描述一下 :语法规范BNF/EBNF形式化描述
和自定义解析逻辑,可以构建完整的语法规范处理系统。以上实现严格遵循 Go 语言规范,通过组合使用标准库。
2025-04-17 13:58:11
504
原创 【gpt生成-总览】怎样才算开发了一门编程语言,需要通过什么测试
开发一门真正的编程语言需要经历完整的设计、实现和验证过程,并通过系统的测试体系验证其完备性。
2025-04-17 13:52:48
811
原创 【模型部署】使用onnxruntime部署yolo11n,提供fastapi接口
triton太臃肿,所以选择onnxruntime进行yolo模型部署,fastapi提供http接口调用。执行docker build --no-cache -t onnx-yolo.可以看到,返回的data中包含识别bbox检测框,置信度以及类别id。
2025-04-15 17:03:18
365
原创 【cursor】cursor的使用体验以及项目实测
这两天试用了下cursor, 发现其对于复杂项目的分析和生成能力挺强。但是,它只能帮你开一个好头, 却不一定能完成整个项目。而让我感兴趣的是,它给出的项目结构与设计思想。
2025-03-27 09:49:08
1009
原创 【deepseek】safetensor模型权重文件中, fp32, fp16, fp8, ini4分别是怎样的形式
以下是 Safertensor 模型权重文件中常见数据格式(fp32/fp16/fp8/int4)的对比表格
2025-02-28 09:23:28
651
原创 【前端】自己从头实现一个gpt聊天页面
制作一个 ChatGPT 界面涉及多个功能点和步骤,以下是一个简要的总结,涵盖了前端和后端的基本构建要求。1. 基本功能点a. 用户输入输入框:用户可以在文本框中输入问题或消息。提交按钮:点击按钮提交输入,或实现键盘快捷键(例如回车键)。b. 显示对话消息显示区:用于展示用户和 ChatGPT 的对话内容。滚动效果:确保聊天框可以自动滚动,显示最新消息。c. 响应生成ChatGPT 交互:根据用户输入,通过后端调用 OpenAI API 或类似的 AI 服务来生成回应。
2025-02-13 11:10:37
1109
2
原创 【前端】整理部分语法 支持的最低版本浏览器
chrome >=107 (win, macos支持, linux不支持)Firefox: 从 Firefox 74 开始支持。Safari: 从 Safari 13.1 开始支持。Chrome: 从 Chrome 80 开始支持。Edge: 从 Edge 80 开始支持。
2024-12-27 16:59:20
350
原创 【多语言】每种语言打印helloworld,编译为exe会占多大空间
python, node都是基于pyinstaller或者pkg打包,懒得整了。rust工具链太大,懒得下。
2024-11-14 14:39:07
422
原创 【flutter】flutter2升级到3.
以这个 https://github.com/aa286211636/Flutter_QQ 为例子, 升级下看看。只有登录界面能正常显示,别的页面都是报错。flutter这版本变动,基本不能直接run。
2024-11-14 11:33:05
815
原创 【linux】centos编译安装openssl1.1.1
解决:ModuleNotFoundError: No module named '_ssl'ERROR: The Python ssl extension was not compiled. Missing the OpenSSL lib?
2024-10-30 11:30:22
1728
原创 【go语言】仅设想,能不能通过pure go编写页面。
wgo run 等价于 yarn serve, 开发模式的页面,加载html到内存。wgo build 等价于yarn build, 构建html到dist/目录下。通过pure-go编写页面, 似乎不太好实现, 就当学习前端html基础了。
2024-10-22 17:44:58
319
原创 【flutter】哪些APP使用了flutter框架开发
Flutter提供了热重载(Hot Reload)和热重启(Hot Restart)功能,允许开发人员在开发过程中实时看到代码更改的效果,无需重新启动应用或模拟器/真机。但是修改代码后,热更新需要手动按R,且比web热更新慢。Flutter内置Material Design和Cupertino(iOS风格)的组件,以及包管理的中心仓库(类似npm)。Flutter应用使用其自定义的渲染引擎Skia来绘制UI,性能优于webview+js的跨端方式,接近于原生。我测,不看不知道,一看还挺多的。
2024-10-15 10:38:07
1179
原创 【rust】 基于rust编写wasm,实现markdown转换为html文本
尝试用rust编写一款markdown转html的插件,通过wasm给html使用,不得不说体积挺小,越200K, 比go的wasm起步2MB看着舒服点。wasm-pack build的时候会调用wasm-opt文件, 自动从gayhub下载, 当然有可能下载不下来,原因你懂的。4核的服务器上build总共8秒, 要是去掉wasm-opt估计1秒多搞定,比go还快了。
2024-09-25 15:12:51
802
原创 【前端】浅聊一下跨域
预检请求用于检查服务器是否允许特定的跨域请求,而实际请求则依赖于服务器的响应头部来决定是否允许访问。成功处理:如果服务器的响应头部中包含允许跨域的相关信息(如 Access-Control-Allow-Origin),并且这些信息与请求的条件匹配,浏览器将允许脚本访问响应数据。一直以来,对于跨域的问题,都是让服务端配置一下允许cors,保证接口能通就行,而没有进一步深究。失败处理:如果响应头部缺少必要的 CORS 信息,或信息不符合请求的条件,浏览器将拒绝访问响应数据,并可能抛出 CORS 错误。
2024-08-20 13:21:28
810
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人