docker打包 1、docker run -it --gpus all --name dockername -p 外网端口:内网端口 -v 机器实际地址:docker地址(/workspace) 镜像名称llm:latest /bin/bash。docker exec -it dockername(镜像名) /bin/bash。docker exec -it ID(镜像名or ID) /bin/bash。docker start dockername(镜像名)
JSON解析 res =str([{'name': '李二二', 'sex': '', 'landline_number': '025-57126822', 'idcard': '', 'phone': ''}, {'name': '杜三平', 'sex': '', 'landline_number': '', 'idcard': '', 'phone': '189'}, {'name': '周东', 'sex': '', 'landline_number': '', 'idcard': '', 'phone': '1
Transformer位置编码详解 在处理自然语言时候,因Transformer是基于注意力机制,不像RNN有词位置顺序信息,故需要加入词的位置信息来显示的表明词的上下文关系。具体是将词经过位置编码(positional encoding),然后与emb词向量求和,作为编码块(Encoder block)的输入信息。据此,即可根据不同的pos信息和i信息得到不同的位置嵌入信息。其中PE的维度为:[序列长度,编码维度](即[seq_len,emb_dim])i表示词向量的位置,偶数位置用sin,奇数位置用cos。pos表示词语在句子中的位置。
大模型相关技术汇总分析 随着大模型技术的发展,基于prompt方式对模型进行微调获得输出是非常普遍的做法,为获得更好的输出,对prompt进行微调是非常重要的。大模型是今年最火的概念,大模型时代必备技巧之一是-----提升工程(Prompt Engineering)。即从数据,模型,参数及执行四个方面均获得了最佳训练效果。完整的大模型由:芯片层->框架层->模型层 组成。4、分组参数切片,Sharding策略。
设计模式之代理模式 1、定义公共接口,这些接口表示所有请求行为;2、定义请求者,继承公共接口,包含准备执行者对象;3、定义代理(proxy),继承公共接口,包含请求者对象,传入被请求者对象;4、调用请求行为;5、竹类中由代理来调用对应请求行为在《大话设计模式》中以追求女生为例,现将自己改造的Java代码显示如下://被请求者public class SchoolGirl { private String name; public String getName() { return name
设计模式之装饰模式 //定义人(物件)public class Person { private String name; public Person(){ } public Person(String name){ this.name = name; } public void Show() { System.out.println("装饰" + this.name); }}//装饰抽象类//需继承对象,从外类拓展对象类功能public class Finery extends P.
策略模式(Strategy) //公共类public abstract class Strategy { public abstract void AlgorithInterface();}//策略Apublic class ContreteStrategyA extends Strategy { @Override public void AlgorithInterface() { // TODO Auto-generated method stub System.out.println("算法A实现");.