skip-gram模型处理文本

目录

理论基础

代码总架构

代码实战

1. 导入包

2. 从文件中提取停止词和训练文本

3. 建立词典以及生僻词用UNK代替

4. 为skipgram生成训练参数

5. 构建模型

6. 调用负采样,抽取管检测

7. 准确率

8. 输出词向量


NLP基础+实战 让机器“写小说”-慕课网 (imooc.com)

理论基础

词向量计算工具word2vec,采用了两种语言模型:

  • CBOW:周围词预测中心词
  • skip gram:中心词预测周围词

权重

负采样

代码总架构

  1. 导入包
  2. 从文件中提取停止词和训练文本
  3. 建立词典以及生僻词
  4. 为skipgram生成训练参数
  5. 构建模型
  6. 调用负采样,抽取管检测
  7. 准确率
  8. 输出词向量

代码实战

1. 导入包

collections:

math:算数集合包

random:

jieba:分词

numpy:数学计算

tf:深度学习框架

os:

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

想要好好撸AI

你的鼓励就是我最大的创作动力!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值