如何将词向量部分向量设置为可训练，其他不可训练

最新推荐文章于 2021-05-05 00:24:15 发布

z2539329562

最新推荐文章于 2021-05-05 00:24:15 发布

阅读量893

点赞数 1

分类专栏：人工智能，调bug 文章标签：变量预训练

本文链接：https://blog.csdn.net/z2539329562/article/details/91462267

版权

人工智能，调bug 专栏收录该内容

61 篇文章 3 订阅

订阅专栏

在 tensorflow 中加载预训练的词向量时，存在一个问题，UNK 没有被训练，如果添加 UNK 需要随机初始化，但是这样不可避免会影响精度，所以，尝试着将词向量设置成部分可训练，部分不可训练。

在写的时候想到，可以将 UNK 和预训练的词向量分开定义，将词向量的变量设置为不可训练，UNK 设置为可训练，然后将这些变量连接起来即可。代码如下：

import tensorflow as tf

tf.reset_default_graph()
x1 = tf.Variable([1], dtype=tf.float32, trainable=False)
x2 = tf.Variable([10], dtype=tf.float32, trainable=True)
X = tf.concat([x1, x2], axis=0)

labels = [1]
logits = tf.reduce_sum(X, axis=0)
loss = tf.reduce_mean(tf.square(logits - labels))

optimizer = tf.train.AdadeltaOptimizer(0.1)
train = optimizer.minimize(loss)

sess = tf.Session()
sess.run(tf.global_variables_initializer())
print(sess.run(X))
for i in range(10000):
    _, value = sess.run([train, loss])
    if i > 9995: print(sess.run(X), value)

输出为：

[  1.  10.]
[ 1.          8.49360371] 72.1448
[ 1.          8.49339581] 72.1413
[ 1.         8.4931879] 72.1378
[ 1.       8.49298] 72.1342

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

z2539329562

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

机器学习笔记 - 支持向量机(SVM)

学以致用知行合一

03-11

5557

支持向量机（Support Vector Machine，SVM）是一个功能强大并且全面的机器学习模型，它能够执行线性或非线性分类、回归，甚至是异常值检测任务。它是机器学习领域最受欢迎的模型之一，任何对机器学习感兴趣的人都应该在工具箱中配备一个。SVM特别适用于中小型复杂数据集的分类。通常SVM用于二元分类问题，对于多元分类可将其分解为多个二元分类问题，再进行分类，主要的应用场景有图像分类、文本分类、面部识别、垃圾邮件检测等领域。

【数据挖掘】5分钟带你了解文本向量化的常见方式

小哲的博客

04-24

777

文本向量化：将文本信息表示成能够表达文本语义的向量，是。词嵌入(Word Embedding)：一种将文本中的词转换成数字向量的方法，属于文本向量化处理的范畴。向量嵌入操作面临的包括：（1）信息丢失：向量表达需要保留信息结构和节点间的联系。（2）可扩展性：嵌入方法应具有可扩展性，能够处理可变长文本信息。（3）维数优化：高维数会提高精度，但时间和空间复杂性也被放大。低维度虽然时间、空间复杂度低，但以损失原始信息为代价，因此需要权衡最佳维度的选择。常见的文本向量和词嵌入方法包括独热模型词袋模型。

参与评论您还未登录，请先登录后发表或查看评论

tensorflow ：使用预训练词向量

热门推荐

xgli的博客

05-19

3万+

目前使用深度网络进行文本任务模型训练时，第一步应该是将文本转为词向量进行处理。但一般词向量的效果跟语料的大小有关，而处理任务的语料不足支持我们的实验，这时就需要使用网上公开的大规模语料训练词向量。 1、下载网上公开的词向量下载地址：https://github.com/xgli/word2vec-api glove的文件说明如何使用预训练词向量，文件格式如下：每行为一个单词和其对应的词

各种预训练的词向量(Pretrained Word Embeddings)

taolusi的博客

07-01

5767

转自：SevenBlue English Corpus word2vec Pre-trained vectors trained on part of Google News dataset (about 100 billion words). The model contains 300-dimensional vectors for 3 million words and phrases...

TensorFlow：使用预训练的词向量

orangefly0214的博客

05-18

2824

https://blog.csdn.net/lxg0807/article/details/72518962

TensorFlow2教程-使用预训练CNN模型

知行_那片天

03-30

6527

Tensorflow 2.0 教程持续更新：https://blog.csdn.net/qq_31456593/article/details/88606284 完整tensorflow2.0教程代码请看tensorflow2.0：中文教程tensorflow2_tutorials_chinese(欢迎star) 入门教程： TensorFlow 2.0 教程- Keras 快速入门 Tenso...

TensorFlow 2.0 - CNN / 预训练 / RNN

Michael是个半路程序员

01-26

742

文章目录1. CNN 卷积神经网络2. 预训练模型学习于：简单粗暴 TensorFlow 2 1. CNN 卷积神经网络卷积神经网络，卷积后尺寸计算 # CNN 模型 class myCNN(tf.keras.Model): def __init__(self): super().__init__() self.conv1 = tf.keras.layers.Conv2D( filters=32, kernel_si

python训练work2vec词向量（python gensim）

shuihupo的博客

12-21

2万+

目录看了很多文章，对与word2vec语料的处理没有那么清晰，现在写下自己处理流程，方便入手的小伙伴，望大家使用的过程中，少走弯路。训练语料格式模型训练 1.安装gensim 2.模型训练 3.模型保存 3.1模型训练保存与加载1（模型可继续训练） 3.1.1模型继续训练 3.2模型训练保存与加载2（模型不可继续训练）模型使用汇总（词语相似度、集合相似度、词向量计算等）...

机器学习（十三）分类算法之支持向量机SVM

提莫君的博客

03-27

3387

支持向量机SVM基础 SVM(Support Vector Machine)指的是支持向量机，是常见的一种判别方法。在机器学习领域，是一个有监督的学习模型，通常用来进行模式识别、分类以及回归分析。支持向量机（SVM）算法比较适合图像和文本等样本特征较多的应用场合。基于结构风险最小化原理，对样本集进行压缩，解决了以往需要大样本数量进行训练问题，它将文本通过计算抽象成向量化的训练数据，提高了分类的精...

基于TF-IDF向量机和多项式朴素贝叶斯的超参数调整新闻分类.zip

最新发布

12-27

在新闻分类任务中，TF-IDF（Term Frequency-Inverse Document Frequency）向量机和多项式朴素贝叶斯...同时，超参数的细致调整对于提升模型性能至关重要，这也是数据分析和机器学习项目中不可或缺的一部分。

NLP-分类模型-2014-文本分类：TextCNN【使用 “CNN”+ 预训练的 “词向量” --＞处理 “句子级别” 的文本分类】

u013250861的博客

05-05

1084

《TextCNN 原始论文：Convolutional Neural Networks for Sentence Classification》一、概述 1、TextCNN 是什么？我们之前提前CNN时，通常会认为是属于CV领域，用于计算机视觉方向的工作，但是在2014年，Yoon Kim针对CNN的输入层做了一些变形，提出了文本分类模型textCNN。与传统图像的CNN网络相比, textCNN 在网络结构上没有任何变化(甚至更加简单了), 从图一可以看出textCNN 其实只有一层卷积,一层max-

Pytorch求索(3)：使用训练好的词向量

腾云

10-17

7931

nn.Embedding Pytorch自带Embedding模块，可以方便使用 self.embed = nn.Embedding(vocab_size, embedding_dim) 那么，如何使用已经训练好的词向量呢？ 词向量其实是模型的embedding层的权重，所以，如下方法便可以实现： self.embed = nn.Embedding(vocab_size, embedding_d...

tensorflow设置部分参数可训练，冻结部分参数

mingo220的博客

12-16

5455

需求：在利用bert进行训练时，需要指定模型中的部分参数不训练方法：设置一个可训练的变量list 代码： update_var_list = [] #该list中的变量参与参数更新 tvars = tf.trainable_variables() for tvar in tvars: if "bert" not in tvar.name: update_var_list.append...

tensorflow 固定部分参数训练，只训练部分参数

Talk Is Cheap

11-27

1万+

def var_filter(var_list, last_layers = [0]): filter_keywords = ['fine_tune', 'layer_11', 'layer_10', 'layer_9', 'layer_8'] for var in var_list: for layer in last_layers: kw...

词向量中加入<PAD>的词向量

u011939633的博客

06-26

648

embtxt = "./test.txt" with open(embtxt,"r+") as f: content = f.read() f.seek(0, 0) text = "'PAD'\t" for i in range(300): text += "0\t" text = text[0:-1] f.write(text + '\...

tensorflow 怎么只训练一部分变量

Do not mess it up

12-25

1979

https://stackoverflow.com/questions/37326002/is-it-possible-to-make-a-trainable-variable-not-trainable/37327561 After looking at the documentation and the code, I was not able to find a way to remove...

预加载词向量的处理

renyuanfang的专栏

02-12

2347

在NLP任务中常常需要预加载的词向量，其中gensim 提供了现成的api供大家使用，但里面往往有些需求无法满足，例如未知词的处理。针对这些情况，自己根据gensim 的源码，进行了重构。本篇文章主要包含两部分内容：1.gensim 原始的调用方式；自己修改过的调用方式，本文词向量以腾讯提供的 Tencent_AILab_ChineseEmbedding.txt 为demo gensim 加载...

Keras自定义可训练参数

z小白的博客

04-04

1万+

Keras自定义可训练参数是在自定义层中实现的，因此需要我们自己编写一个层来实现我们需要的功能。话不多说，直接上实例。假设我们需要自定义一个可学习的权重矩阵来对某一层的数据进行转换，则可以通过下面代码实现： from keras import backend as K from keras.layers import Layer class MyLayer(Layer): def...

ELMO中文词向量训练及使用的完整流程

weixin_44081621的博客

03-24

9836

笔者最近在学习elmo中文的词向量训练及使用，由于网上相关资料比较缺乏，学起来比较吃力。现将相关学习过程记录如下，希望后来者可以少走些弯路。（免责声明：笔者也处于初学阶段，不能保证本文的过程及结果正确）本文elmo词向量的训练主要参考： https://github.com/searobbersduck/ELMo_Chin 但该代码有些问题，训练过程中陷入了死循环，笔者一直找不到问题出在哪，后来...

人体行为识别：全局与局部特征融合的改进算法

词袋模型是一种统计方法，可以将一组复杂的特征转换为可比较的向量形式，从而提高分类效率和准确性。通过这种方式，算法能够捕获更多的行为模式，增强了识别的鲁棒性。最后，融合了全局和局部特征的行为特征被输入...