目录
NLP基础+实战 让机器“写小说”-慕课网 (imooc.com)
理论基础
词向量计算工具word2vec,采用了两种语言模型:
- CBOW:周围词预测中心词
- skip gram:中心词预测周围词
权重
负采样
代码总架构
- 导入包
- 从文件中提取停止词和训练文本
- 建立词典以及生僻词
- 为skipgram生成训练参数
- 构建模型
- 调用负采样,抽取管检测
- 准确率
- 输出词向量
代码实战
1. 导入包
collections:
math:算数集合包
random:
jieba:分词
numpy:数学计算
tf:深度学习框架
os: