自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(22)
  • 收藏
  • 关注

原创 【实践】VLLM显存暴增 | 多卡推理 | 批量推理

用两张A800跑Llama3-8B,按理说显存占用应该在16G以上,浮动2~3G,但是发现显存直接拉满了,一共花了140G发现通过vllm.LLM创建模型时,有个参数控制GPU的使用量,其默认值为0.9,正好是140/160将改成0.15,也就是160*0.15 =21G时,模型运行正常,且显存占用压到了21G但问题就来了,为什么16G的模型在设置的时候,会占用140G的显存呢,除了模型本身的参数之外,显存里面还装了什么东西?在 vLLM 中,我们发现 LLM 服务的性能受到内存的瓶颈。

2024-04-23 22:39:37 2760

原创 【LangChain】如何优雅的构造prompt

我们要想自定义一个prompt,习惯行写一个txt文档,里面放prompt_template构建prompt时,先定义变量,导入template之后,替换掉对应变量这样一类prompt就对应着一个template(txt文件),以及一个构造函数,文件一多就很烦。

2024-04-11 21:57:28 447

原创 【实践】Qwen1.4-14B-Chat在roleplay对话数据上的微调

test。

2024-03-26 08:54:36 149

原创 Qwen1.5-14B-Chat使用与多方式部署(Linux和GPU环境)

test。

2024-03-26 08:53:29 1599

原创 Ubuntu 多GPU环境下设置某些GPU可用

服务器上有3张卡,但只使用第二张和第三张卡。

2024-03-20 14:26:38 185 1

原创 更换指定Huggingface/Modelscope默认下载位置

*Step1:**打开配置文件。

2024-03-20 14:07:51 1800 1

原创 【实践】对文本数据进行下采样

test。

2024-03-14 14:20:05 304 1

原创 什么是生成文本的采样策略,如何实现?

采样”(sampling)是指在文本生成过程中从模型的概率分布中选择词汇的过程。在自然语言处理和特别是在使用语言模型生成文本的过程中,用于决定下一个时间步生成哪个词。

2024-03-03 15:37:44 391

原创 什么是梯度裁剪

1. 梯度裁剪的主要目的是防止梯度爆炸问题,即梯度的值变得非常大,导致模型无法正常学习。2. 在差分隐私中,梯度裁剪还有助于限制单个数据点对模型更新的影响,从而提高隐私保护。,对于计算出的每一个梯度,计算其L2范数(即梯度向量的长度),则将梯度裁剪(缩放)为。:确定一个梯度裁剪阈值。

2024-03-02 12:08:47 419 1

原创 面向对象知识恶补

实例:车间工厂类生产螺母类、螺丝类、锤子类三种产品,客户端通过参数从工厂类中获得螺丝类实例,当螺丝类的生产(实例化)过程发生改变时,只需要修改工厂类中实例化的代码,客户端代码不动。有一个单独的工厂类,你可以传递一个参数到工厂类的静态方法(工厂类不被实例化),工厂类根据参数的不同返回不同类的实例。可以通过类直接调用,而不用创建类的实例,多用于工具或帮助类(比如工厂类)优点:让类的实例化延迟到子类中进行,客户端代码不直接实例化对象,而是通过工厂类来完成,这样客户端代码从具体类中解耦,依赖于接口/抽象类。

2024-02-28 10:28:33 118

原创 差分隐私(differential privacy)

用来保护用户隐私,但用户不确定企业是否将隐私匿名化,以及匿名化的程度。Netflix发布了电影评分数据集,包括100M条评分,480k用户,17K电影,并匿名化处理,但有研究者结合Netflix和IMDB数据库,成功识别出一些人;匿名化后的马萨诸塞州的医疗记录和选票记录相结合,发现符合州长的邮编、出生日期、性别只有一人,因此暴露了州长的医疗记录。”,在已知噪声分布的前提下,给出一些补偿,最终得到一个相对准确的统计结果。当企业需要用户的数据提升自己算法的性能,用户担心数据隐私遭到泄露时,矛盾便出现了。

2024-02-27 16:25:18 256

原创 A dependency job for cockpit.service failed. See ‘journalctl -xe‘ for details.

ubuntu安装cockpit

2024-02-26 17:22:39 351 1

原创 linux部署Mixtral-8x7B-Instruct实践(使用vLLM/ transformer+fastapi)

Linux下用vLLM本地部署Mixtral-8x7B-instruct,部署成功

2024-02-16 22:19:52 2049

原创 23/04/16使用pyecharts绘制中国地图并显示城市

用pyecharts插件制作标记六个大学所在城市分布的中国地图高清图

2023-04-16 23:12:01 5542

原创 北邮机试-IP地址

看了AC代码,使用了sscanf(从字符串中读取数据)方法,哦,原来这道题考这个。将string类型转化为符合c语言的char *类型。

2023-03-18 13:20:36 95

原创 北邮机试题-IP数据包解析

因为cin, scanf等输入都会省略这个多余的换行,但是getline不会,于是就把换行读入作为一个数据了,所以要在输入T之后,使用cin.get()把多余的换行符读出来。使用getline时,假如前面已经有一个输入T,我们默认输入T之后敲回车,如此读入T的同时,也在输入流中多加了一个回车。

2023-03-17 11:17:04 106

原创 最小距离查询

最小距离查询时间限制 1000 ms 内存限制 65536 KB题目描述给定一个由小写字母 a 到 z 组成的字符串 S,其中第 i 个字符为 S[i](下标从 0开始)。你需要完成下面两个操作:INSERT c 其中 c 是一个待输入的字符。你需要在字符串的末尾添加这个字符。保证输入的字符同样是 a 到 z 之间的一个小写字母。QUERY x 其中 x 是一个输入的整数下标。对于这个询问,你需要回答在 S 中和 S[x]相等且与 x 最近的距离。输入保证 x 在当前字符串中合法例如 S = “

2023-03-15 15:34:29 87

原创 中序遍历序列

【代码】中序遍历序列。

2023-03-15 11:54:21 85

原创 【无标题】

题目统计节点个数时间限制 1000 ms 内存限制 65536 KB题目描述给出一棵有向树,一共有 N(1<N≤1000)个节点,如果一个节点的度(入度+出度)不小于它所有儿子以及它父亲的度(如果存在父亲或儿子),那么我们称这个节点为 p 节点,现在你的任务是统计 p 节点的个数。如样例,第一组的 p 节点为 1,2,3;第二组的 p 节点为 0。输入格式第一行为数据组数 T(1≤T≤100)。每组数据第一行为 N 表示树的节点数。后面为 N−1 行,每行两个数x,y(0≤x,y&lt

2023-03-15 11:45:22 35

原创 vscode调试c++配置tasks.json和launch.json文件

解决vscode调试c++程序的配置问题

2022-06-07 23:55:19 6009 2

转载 解决Maven项目pom.xml文件出现红叉但是没有错误信息

1.首先看一下下面的这两个项目,一个是新建的,一个是原来的老项目2.myEcplise中是点击如下图 Maven4MyEcplise, Ecplise中也是右键,只不过点击Mavene而已,两个一样3.  强制更新Maven4.一会 红叉就消失了...

2021-10-18 16:50:20 2478 1

原创 操作系统理论和应用的交互理解

操作系统概念:操作系统是一组能有效的组织和管理计算机硬件和软件资源,合理地对各类作业进行调度,以及方便用户使用的程序的集合。应用:操作系统也属于软件,在开机时首先被加载到内存:操作系统一般由bootloader从存储设备加载到内存里。bootloader也是一段程序,一般也是放在在存储设备上的。x86 的机器上一般由系统固件 BIOS 或者 EFI 固件将bootloader加载到内存里。固件其实也是一段程序,不过是烧在主板的某个芯片里的,格式和硬件加载的方式都是由标准定义的。h内存概念:

2021-10-15 17:08:33 204

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除