聊一聊有监督、无监督学习的界线 有监督学习无监督学习常有疑惑 有时困惑,现在的模型都有loss 为啥还说无监督呢? 有监督学习 有明确给出的输出值y,学习的是输入x到y的表达模型 无监督学习 想要输出值y,但是没有,通过样本来学习y的分布 常有疑惑 word2vec 为啥不是有监督模型,明明上下文就是中心词的正样本(CBOW)。原因: word2vec 模型,想要的是一个word->vec。vec 我们不知道。至于上下文就是中心词的正样本,这只是要获取词在莫个空间分布的一种方法。训练模型必然要有loss。这里的正样本是我们自己定义,用来间接获取vec的方法。