1.可以输入中间词来预测上下文CBOM
2.可以根据上下文预测中间值Skip gram
存在问题:
语料库太大时可能造成万级甚至更大分类
例如 输入 he is
输出可能为 person,dog,cat,bird ......等结果
为了解决这一问题rnn直接将把输入和期望的
输出结果都作为网络的输入,用网络来预测
负采样模型:
上述方法会存在这样的问题,机器会想一直往1猜
所以我们需要负采样,对一些词标0
例如:
he is play 需要把play标0
负采样模型推荐5个比较合适