自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 4090拼好卡,穷鬼套餐运行官方权重Kimi-K2.5上下文256K

之前所有设备都是pcie 5.0,drr5内存,但是当前的价格如果ddr5 ecc内存如果按照2T的标准来(32*64G),那么含税65万是至少需要的(1.8万一条不含税)。这里我直接上运行的日志图吧,在没有预热的情况下官方权重输出是20t/s,预热完成后可以到40t/s(这个忘记截图了,暂时把设备停了准备去做专门的优化),编程是够用了,而且这套我还没从源码上优化,只是调了参数,从通讯的数据上看是肯定还可以优化的,没改动前显卡decode利用率没有低于80%,prefill利用率是100%。

2026-03-30 02:16:41 398

原创 Ubuntu 24.02 系统下的 jenkins配置MicroK8s 教程

这里是使用的ubuntu24.02系统版本,为什么会选择使用microk8s,因为这可能是最简单k8s,而且足够轻量化。,当你创建一个 ServiceAccount 时,Kubernetes 会自动创建一个类型为。角色(这是一个超级管理员角色,拥有所有权限),这对于快速设置或测试环境很方便。无论 Jenkins 是部署在集群内部还是外部,最佳实践都是为它创建一个专用的。这里需要注意的是microk8s端口用的是16443,需要忽略证书错误。为其创建一个 Secret,或者在 Pod 中通过。

2025-11-27 00:09:17 285

原创 docker开启远程服务(含鉴权,jekins用法,一键脚本)

本地套接字通信,无网络层面的身份验证和数据加密,若暴露在公网或不安全网络中,可能导致未授权访问、容器被篡改、数据泄露等风险。TLS(Transport Layer Security)配置的核心是通过「证书认证」实现双向身份验证和通信加密。一般情况下也用不到这个,jekins推荐直接将宿主docker挂载最方便。,若输出 Docker 系统信息,说明 TLS 通信正常。这里需要创建一个sh脚本,保存为如docker.sh。Docker 默认通过。

2025-11-23 20:52:50 158

原创 CTF AI 神器Qwen3-30B-A3B-Thinking-2507

没有选用coder是因为这个Qwen3-30B-A3B-Thinking-2507完全够用了,这里使用了量化版本,上下文达256K,速度还是相当靠谱得,解一道apk逆向得题只花了5分半!这个主要是针对离线环境需求,雷电显卡坞带张4090 48G出去不得直接起飞?显存是吃到42G,所以5090就暂时不要考虑了,4090 48G才是正解。MCP这里用的是jadx-mcp-server。

2025-08-06 01:39:42 880

原创 Qwen/Qwen3-30B-A3B-Thinking-2507-FP8(简单测试情况,linux,含部署教程,含踩坑)

踩坑:一开始以为是掉驱动,后来是发现一张卡估计压力测试下质量翻车了,不过同时研究了换驱动的方法,对于需要更换显存,建议自己看情况换版本,能够避免切换版本导致。然后安装one-api,方便API管理,可以选择不开端口访问,使用lucky转发还便于套证书(这里就不写教程了,很简单),但是局域网环境就开放就行。token数是干到125t/s,之前测试过gguf的30ba3b,这模型基本逻辑能力是不用怀疑得,基本够用,最求轻量速度得可以考虑这个模型。然后是1panel应用商店安装mysql,建议不开端口外部访问。

2025-08-06 00:09:14 1532 2

原创 AI小模型(Qwen3-30B-A3B)MCP(ida-pro-mcp)逆向教学提示词(cherry studio和roo code)

经实际测试,本地部署模型时,若使用 24G 显存,显卡可选择两张 M40 12g(价格约 500 元左右)。当然你有3090等卡更好。目前还在进一步测试,理论上安卓的so库逆向也可以用这个干,MCP动态调试的教程等有空研究了看看。我用的启动参数如下,依据个人需求改就行,弄不来的用ollama改下上下文也行,部署就不做过多教学了。把提示词丢给mcp客户端,再用ida打开对应的文件,插件中启用mcp,需求丢AI等结果就行。IDA的MCP部署可以参考下面两篇文章,别人已经写的很详细了,我这里就不多详细步骤了。

2025-07-23 00:16:52 2283

原创 8卡3090使用AWQ量化版基于vllm0.8.5成功启动“Qwen3-235B-A22B“教程(22.7t/s)

8卡3090部署Qwen3-235B-A22B教程

2025-05-06 16:15:11 2082

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除