自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 笔记本本地部署100b以上千亿级别LLM,并在手机端接入

本文将演示如何在笔记本上运行千亿级模型,后端 Koboldcpp 运行在 Ubuntu ,前端界面使用安卓手机通过 Termux 且使用 SillyTavern 进行连接,模型使用 104B 的的 Q4KM 量化,以及 123B 的的 Q3KM 量化作为演示,两者模型的性能强悍,中文表现良好,可匹敌早期的 GPT-4-0314。

2024-07-28 23:53:12 1451

原创 实机演示联想拯救者R7000P安装Ubuntu Server与Win10双系统

本人使用的是UEFI,首先找一块未分配的空闲空间, 分配50G左右的预留空间用来存放ubuntu,如果该硬盘上没有efi启动引导盘符,则还要分配1G大小的盘符用来作为启动引导盘,本人已经有一个837MB大小的efi的boot引导盘, 后续win和ubuntu的启动引导信息都会被放在这里,这里选择下图未分配的51.12G空间, 选择新建简单卷, 一路下一步即可,efi的引导盘同理。Win端使用SSH可使用NxShell,安卓端可使用Termius,或者直接终端使用ssh都行,根据个人习惯而定,这里不多赘述。

2024-07-28 19:20:30 2071

原创 手机安装系统部署LLM的方法

首先模型选择GGUF格式, 选择Q4_K_M或Q5_K_M量化手机内存8~12G或以上均可尝试, 参数一般选择7~13B以下是模型推荐及其大小, 需根据手机内存实际情况选择:Hermes-2.5-Yi-1.5-9B-Chat-i1-GGUF (中文模型, Q4量化5.33G, Q5量化6.26G)Qwen2-7B-Multilingual-RP-GGUF (中文模型, Q4量化4.68 G, Q5量化5.44 G)

2024-07-16 17:30:41 1468

原创 LeetcCode困难题——奇妙序列扩展欧几里得算法解法

也是为了符合题目要求,先考虑初步的思路,目前只考虑在data数组中已元素且在此之前还没有进行任何addAll和multAll操作的情况,此时再开始进行加与乘操作,如果想在。,因此相较于费马小定理的快速幂,可以更快的得出逆元,本题在append函数实现求逆操作并整合到data中,并且在getIndex中获取。,这里的t就是本题要求的逆元,同样采用递推的思路来减少时间和空间开销,为了实现递推,可以设。,会无法通过本题,对于值溢出的情况,需要在每次涉及到运算的地方取模。

2023-12-03 23:13:04 50

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除