- 博客(4)
- 收藏
- 关注
原创 BiLSTM学习笔记
1、proj_size是指在计算出隐状态hi之后,另外使用一个投影矩阵(projection matrix)来把隐状态从hidden_size投影到proj_size维度。这个投影矩阵也是可学习的。 2、LSTM产出3种结果,第一个是output,是最后一层LSTM产出的每个时间节点t的隐状态合集,如果LSTM是双向的,则会拼接每个时间点t的正向和反向的结果,作为这个时间t的结果。 第二个是h,是每一层的LSTM的每个方向的最后一个时间节点t的隐状态结果,这个维度大小和刚开始初始化时丢进去的h大小是一样
2022-01-10 10:06:46 680
原创 torch的bert模型转为tensorflow的bert模型
from transformers import BertTokenizerFast from transformers import TFBertModel from transformers.models.bert.modeling_bert import BertPreTrainedModel, BertModel from tensorflow.keras import backend as K bert_model = TFBertModel.from_pretrained(torch_pat.
2021-12-07 16:47:01 833
原创 python的一些小技巧
1、使用分段执行法: 在代码块前加入#%%,右下角提示框选择Use scientific mode 2、查看当前程序的执行路径: import os print(os.getcwd()) 3、输出虚拟环境的依赖: pip freeze > requirements.txt 4、按10个空格输出某个字符串,负号代表左对齐,不加负号代表右对齐。以及输出某小数的2位小数,逗号表示千位符: print('this is a %d test for %d dollar is %s very m
2021-05-19 13:09:39 141
原创 python对txt,json,jsonl,csv,xlsx读取操作,dataframe的增删改查学习
使用pysenal包中的read_json,read_jsonl,read_file,write_json,write_jsonl,write_file方法来对json文件和text文件进行读写 from pysenal import read_json,read_file,read_jsonline import os print(os.getcwd()) data1 = read_json('data/shiv.json') data2 = read_jsonline('data/test.json
2021-05-12 20:40:08 620
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人