10、TensorFlow教程--- 词嵌入

词嵌入是机器学习中将单词映射到向量的关键技术。本文聚焦TensorFlow实现,介绍如何利用Word2vec进行无监督学习,通过预测单词上下文提升模型效果。TensorFlow提供多种优化的模型实现,支持多线程和高级抽象。
摘要由CSDN通过智能技术生成

词嵌入是将诸如单词之类的离散对象映射到向量和实数的概念。这对于机器学习的输入非常重要。该概念包括标准函数,可以有效地将离散输入对象转换为有用的向量。

词嵌入输入的示例如下所示 -

blue: (0.01359, 0.00075997, 0.24608, ..., -0.2524, 1.0048, 0.06259)
blues: (0.01396, 0.11887, -0.48963, ..., 0.033483, -0.10007, 0.1158)
orange: (-0.24776, -0.12359, 0.20986, ..., 0.079717, 0.23865, -0.014213)
oranges: (-0.35609, 0.21854, 0.080944, ..., -0.35413, 0.38511, -0.070976)

Word2vec
Word2vec是最常用的无监督词嵌入技术方法。它通过使用跳跃图来训练模型,以使给定的输入词通过预测单词的上下文来预测。

TensorFlow提供了许多实现这种类型模型的方法,具有不断增加的复杂性和优化,使用多线程概念和更高级别的抽象。

import os 
import math 
import numpy as np 
import tensorflow as tf 

from tensorflow.contrib.tensorboard.plugins import projector 
batch_size = 64 
embedding_dimensio
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Knowledgebase

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值