自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 收藏
  • 关注

原创 12.2 算法模型三大框架(Encoder-Only、Encoder-Decoder、Decoder-Only)

多个只有Self-Attention和mlp的Transformer层串联起来Encoder-Only 架构,也被称为单向架构,仅包含编码器部分。它主要适用于不需要生成序列的任务,只需要对输入进行编码和处理的单向任务场景,如文本分类、情感分析等。这种架构的代表是 BERT 相关的模型,例如 BERT、RoBERT 和 ALBERT 等。Encoder-Only 架构的核心思想是利用神经网络对输入文本进行编码,提取其特征和语义信息,并将编码结果传递给后续的处理模块。

2024-06-19 15:34:06 1774

原创 12.1 Subword方法(BPE、WordPiece、ULM)

与WordPiece一样,Unigram Language Model(ULM)同样使用语言模型来挑选子词。不同之处在于,BPE和WordPiece算法的词表大小都是从小到大变化,属于增量法。ULM算法考虑了句子的不同分词可能,因而能够输出带概率的多个子词分段。与BPE算法类似,WordPiece算法也是每次从词表中选出两个子词合并成新的子词。与BPE的最大区别在于,如何选择两个子词进行合并:BPE选择频数最高的相邻子词合并,而WordPiece选择能够提升语言模型概率最大(似然概率)的相邻子词加入词表。

2024-06-19 14:50:35 318

原创 CS224n自然语言处理算法笔记目录

seq2seq(softmax去预测output beam search)以及词向量表示的训练 CBOW skip-gram。的思路 从ont-hot 到 word2vec。一词多义问题(后续见得不多 这里不做过多了解)(我理解为Tokenizer的的训练过程)RNN神经网络(有点老,暂时不详细了解)NER(命名实体识别)任务。

2024-06-18 17:58:03 431

原创 CS224n算法课程笔记1(lesson1-3)

基础知识

2024-06-18 17:38:42 221

原创 vue前端简单页面编写

Html部分:代码框架:<template> <!-- 请求栏:输入框、选择框、日期框 + 查询、重置 范例如下--> <div class="table-page-search-wrapper"> <a-col :md="8" :sm="24"> <a-form-item label="用户ID" style="font-weight: 500;font-size: 16px;"> <

2021-08-23 11:09:41 2426

原创 14RESTful

1. RESTful概念REST全称是Representational State Transfer,中文意思是表述(编者注:通常译为表征)性状态转移。REST指的是一组架构约束条件和原则。" 如果一个架构符合REST的约束条件和原则,我们就称它为RESTful架构。1.1资源与URLURI设计技巧使用_或-来让URI可读性更好使用/来表示资源的层级关系使用?用来过滤资源,或;可以用来表示同级资源的关系1.2 统一资源接口RESTful架构应该遵循统一接口原则,统一

2021-06-22 11:27:50 87

原创 MySQL报错

[23000][1062] Duplicate entry '' for key 'xxxx'问题:在使用MySQL新增项目时出现的错误原因分析:大概率是你新增的unique项目重复了,只需要找到新增的一项中unique的那一目录更改一下就好了

2021-06-18 10:34:03 155

原创 12JDBC编程

1. JDBC简介使用JDBC的好处是:各数据库厂商使用相同的接口,Java代码不需要针对不同数据库分别开发;Java程序编译期仅依赖java.sql包,不依赖具体数据库的jar包;可随时替换底层数据库,访问数据库的Java代码基本不变。2. JDBC查询连接核心代码是DriverManager提供的静态方法getConnection()。因为JDBC连接是一种昂贵的资源,所以使用后要及时释放。使用try (resource)来自动释放JDBC连接是一个好方法try (Connectio

2021-06-15 16:45:29 275 2

原创 11泛型概述

1. 概述泛型就是编写模板代码来适应任意类型;泛型的好处是使用时不必对类型进行强制转换,它通过编译器对类型进行检查;注意泛型的继承关系:可以把ArrayList<Integer>向上转型为List<Integer>(T不能变!),但不能把ArrayList<Integer>向上转型为ArrayList<Number>(T不能变成父类)。2. 使用泛型使用ArrayList时,如果不定义泛型类型时,泛型类型实际上就是Object当我们定义泛型类型&l

2021-06-11 14:26:16 1061 1

原创 10注解概述

1. 使用注解注解是放在Java源码的类、方法、字段、参数前的一种特殊“注释”:// this is a component:@Resource("hello")public class Hello { @Inject int n; @PostConstruct public void hello(@Param String name) { System.out.println(name); } @Override publ

2021-06-10 19:21:50 101

原创 09反射概述

1. Class类JVM为每个加载的class及interface创建了对应的Class实例来保存class及interface的所有信息;获取一个class对应的Class实例后,就可以获取该class的所有信息;通过Class实例获取class信息的方法称为反射(Reflection);JVM总是动态加载class,可以在运行期根据条件来控制加载class。如何获取一个class的Class实例?有三个方法:方法一:直接通过一个class的静态变量class获取:Class cl

2021-06-10 16:26:41 64

原创 08集合总结

1. 集合简介Java的java.util包主要提供了以下三种类型的集合:List:一种有序列表的集合,例如,按索引排列的Student的List;Set:一种保证没有重复元素的集合,例如,所有无重复名称的Student的Set;Map:一种通过键值(key-value)查找的映射表集合,例如,根据Student的name查找对应Student的Map。2. 使用List我们考察List<E>接口,可以看到几个主要的接口方法:在末尾添加一个元素:boolean add(E e

2021-06-10 11:26:03 1062

原创 07异常处理

1. Java异常 ┌───────────┐ │ Object │ └───────────┘ ▲ │ ┌───────────┐ │ Throwable │

2021-06-09 16:02:43 93

原创 06Java核心类

1. 字符串与编码1. StringString s1 = "Hello!";具体表现方法String s2 = new String(new char[] {'H', 'e', 'l', 'l', 'o', '!'});字符串比较一般使用equals(),一般不使用==要忽略大小写比较,使用equalsIgnoreCase()方法。搜索子串的更多的例子:"Hello".indexOf("l"); // 2"Hello".lastIndexOf("l"); // 3"Hell

2021-06-09 14:45:44 87

原创 05面向对象编程

面向对象编程1.概述面向对象的基本概念,包括:类实例方法面向对象的实现方式,包括:继承多态Java语言本身提供的机制,包括:packageclasspathjar以及Java标准库提供的核心类,包括:字符串包装类型JavaBean枚举常用工具类2. 基础1.方法构建public类对象class Person { public String name; public int age;}调用类(public 公开类)Person

2021-06-09 11:11:22 108

原创 04数组操作概述

1. 遍历数组for循环索引public class Main { public static void main(String[] args) { int[] ns = { 1, 4, 9, 16, 25 }; for (int i=0; i<ns.length; i++) { int n = ns[i]; System.out.println(n); } }}for e

2021-06-08 15:59:18 69

原创 03流程控制概述

1.输入和输出输出System.out.println() //输出并换行println是print line的缩写,表示输出并换行。因此,如果输出后不想换行,可以用print():System.out.printf() //格式化输出通过使用占位符%?,printf()可以把后面的参数格式化成指定格式占位符说明%d格式化输出整数%x格式化输出十六进制整数%f格式化输出浮点数%e格式化输出科学计数法表示的浮点数%s格

2021-06-08 14:45:00 76

原创 01Java基础

快捷:主函数(psvm) 输出(sout)1、注释、标识符、关键字(1)注释单行注释//多行注释/* */文档注释(javadoc)/**@...*/[(2)关键字]((2条消息) Java关键字_weixin_43131525的博客-CSDN博客)abstractassertbooleanbreakbytecasecatchcharclassconstcontinuedefaultdodoubleelseenu

2021-06-08 10:24:03 63

原创 02Java关键字

abstractassertbooleanbreakbytecasecatchcharclassconstcontinuedefaultdodoubleelseenumextendsfinalfinallyfloatforgotoifimplementsimportinstanceofintinterfacelongnativenewpackageprivateprotectedpublicretu...

2021-06-08 10:16:49 98

原创 DOS命令

盘符切换D:查看当前目录的所有文件dir切换目录cd 目录 切换指定目录cd .. 切换上级目录清理屏幕cls 退出终端exit查看电脑ipipconfig打开应用calc 计算器mspaint 画图notepad 记事本ping命令ping www.baidu.com文件操作md 目录 创建文件夹rd 目录 删除文件夹cd> 文件名 创建文件del 文件名

2021-06-07 14:18:51 72

原创 Redis学习笔记

Redis学习笔记启动数据库redis-server.exe redis.windows.conf运行数据库redis-cli.exe -h 127.0.0.1 -p 6379数据类型:string(字符串):最基本类型,实现方式:set、get、deleg:set 键 值(字符串)127.0.0.1:6379> set key '981121'OK127.0.0.1:6379> get key"981121"127.0.0.1:6379> del key

2021-06-07 11:23:58 67

原创 20210203 MySQL学习笔记

20210203 MySQL学习笔记1.1基础语法show databases; #查看当前所有数据库create database 库名; # 创建新库use 库名; #转入某库show tables; #查看当前库的所有表show tables from 库名; #查看其他库的所有表create table 表名(列名 类型名,列名2 类型名,。。。); #创建表规范例如CREATE TABLE students( `id` INT(11) NOT N

2021-06-07 11:22:38 96

原创 2021.2.2 git bash学习笔记

2021.2.2 git bash学习笔记1.1基础操作git status 查看当前状态mkdir test 创建test文件夹touch test.py 创建test.py文件初始化Gitcd test 切换到test文件夹Git init 初始化仓库1.2添加文件git add a1.pygit commit -m “描述”1.3修改文件Vi a1.py 完成后按esc键,输入:wq退出git add a1.py git commit -m

2021-06-07 11:18:42 96

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除