Keras实现Embding编码

最新推荐文章于 2023-12-09 23:43:50 发布

雨轩智能

最新推荐文章于 2023-12-09 23:43:50 发布

阅读量482

点赞数 1

分类专栏： python智能算法文章标签： keras 深度学习机器学习

本文链接：https://blog.csdn.net/qq_30895747/article/details/130341801

版权

python智能算法专栏收录该内容

35 篇文章 6 订阅 ¥69.90 ¥99.00

订阅专栏

Embedding 字面理解是 “嵌入”，实质是一种映射，从语义空间到向量空间的映射，同时尽可能在向量空间保持原样本在语义空间的关系，如语义接近的两个词汇在向量空间中的位置也比较接近。

下面以一个基于Keras的简单的文本情感分类问题为例解释Embedding的训练过程：

首先，导入Keras的相关库

from keras.layers import Dense, Flatten, Input
from keras.layers.embeddings import Embedding
from keras.models import Model
from keras.preprocessing.sequence import pad_sequences
from keras.preprocessing.text import one_hot
import numpy as np

给出文本内容和label

# define documents
docs = ['Well done!',
        'Good work',
        'Great effort',
        'nice work',
        'Excellent!',
        'Weak',
        'Poor effort!',
        'not good',
        'poor work',
        'Could have done better.']
# define class labels
labels = [1, 1, 1, 1, 1, 0, 0, 0, 0, 0]

然后将文本编码成数字

了解本专栏

雨轩智能

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
Keras实现Embding编码

上面的one-hot把每一个单词映射成一个整数，但实际上这个整数就表示了50维向量中 1 所在的索引位置，用整数显示是为了更好理解和表示，而实际在网络中，它的形式可以理解为如下图（下面相当于one-hot向量为5维，输出embedding向量为3维）右边的神经元为one-hot输入，左边为得到的embedding表示，图中1所对应的红线权重就是该单词对应的词向量，这一层神经元只能作为第一层嵌入，是没有偏置和激活函数的，它也可以被理解为如下的一个矩阵相乘，输出就是该单词的词向量。然后词向量再输入到下一层。
复制链接

扫一扫