- 博客(5)
- 收藏
- 关注
原创 工具分享篇--垫付费用AA分摊计算
摘要:针对多人打羽毛球时因各自带球导致费用分摊复杂的问题,作者开发了一款创新小程序。该程序不仅具备常规AA功能,还特别添加了"垫付人员"选项,能灵活记录不同成员的垫付情况,完美解决了多人运动场景下的费用分摊难题,比市面常见AA工具更贴合实际使用需求。
2025-08-19 09:25:39
381
原创 K8S集群构建实验完整步骤,新手保姆教程
Kubernetes实现的最重要的工作是对Docker容器集群统一的管理和调度,通常使用命令行来操作Kubernetes集群及各个节点,命令行操作非常不方便,如果使用UI界面来可视化操作,会更加方便的管理和维护。修改文件recommended.yaml的39行内容,#因为默认情况下,service的类型是cluster IP,需更改为NodePort的方式,便于访问,也可映射到指定的端口。Kubenetes命令行工具,通过Kubectl可以部署和管理应用,查看各种资源,创建,删除和更新组件。
2025-08-07 10:10:23
959
原创 大模型部署&接口调用监控&性能测试实践
摘要:本文详细介绍了在昇腾服务器NPU卡上部署QWQ-32B大模型的完整流程。主要内容包括:使用mindie20t18容器镜像的配置方法,关键参数设置(如端口1025-1027、模型路径等),容器启动命令及设备映射配置,环境变量设置和服务启动步骤。文章还提供了服务化推理的配置文件详细说明,包括服务器配置、后端配置和调度策略等关键参数。此外,包含了性能测试方法、常见问题解决方案(如transformers版本兼容性问题)以及监控接口调用的操作指南。最后,通过benchmark工具展示了模型性能测试结果,包括吞
2025-08-06 10:10:09
612
原创 nginx配置https反向代理AI实践
摘要:针对华为云HCS851+ModelArts仅支持HTTPS协议的问题,本文提出通过Nginx实现HTTPS反向代理的解决方案。具体步骤包括:安装Nginx,配置虚拟主机(监听443端口并指定证书路径),设置后端HTTP服务地址(10.32.24.241:1025),以及处理SSL证书不匹配问题(通过openssl重新生成密钥对)。最终通过curl测试https://10.32.59.39/generate验证配置成功。文中还提供了自签名证书问题的临时解决方案(-k参数)和长期信任方案。
2025-08-06 09:59:05
959
1
原创 首发 部署prometheus+grafana监控AI大模型 metrics
方案一:前端UI界面+JavaScript+Chart.js动态渲染图表和数据可视化前端代码较多不便展示,感兴趣的可以借助AI自行编写方案二:部署Prometheus+Grafana,将http://ip/metrics返回的数据通过Grafana渲染以下为方案二部署Prometheus+Grafana方式进行大模型性能监控过程。
2025-08-06 09:22:00
5198
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅