自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 面向资源受限边缘设备的MoE架构大模型部署优化研究——以DeepSeek R1 7B为例

说得直接一点:在4核8G这种“寒酸”配置上跑7B模型,你不是在做实时AI聊天,而是在把大模型当成一个离线智能处理引擎。如果你一定要跑4096上下文,那请务必开启KV cache 8-bit量化:在llama.cpp中加--k-quant --v-quant,实测内存会再降400MB,但生成速度也会掉10%~15%。如果你手头有一台老旧的迷你主机、云上的廉价VPS(4核CPU + 8GB内存),想在本地跑一个7B参数的大模型,而不是每次都用API——可以跑,但不是用来聊天的。GGUF就是为CPU设计的。

2026-05-15 06:09:34 656

原创 《35个免费AI API实测合集(2026最新)——我搭了个站每天更新》

Gemini、DeepSeek、Grok、Cerebras、硅基流动、Pollinations AI、Mistral、通义千问、Llama3、智谱AI。但市面上的API资源杂乱无章、失效速度极快,网上很多合集都是几年前的过期内容,踩坑无数之后,我决定自己手动收集、实测整理全网免费AI接口。整理免费AI API一直是很多开发者的刚需,不管是个人练手、搭建副业项目,还是给自己的网站接入AI能力,免费接口都是性价比最高的选择。覆盖中文对话、英文推理、AI绘图、代码生成、多模态识图等全部常用场景,个人完全够用。

2026-05-08 23:19:23 1202

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除