Source of code and tutorial: https://www.kaggle.com/c/word2vec-nlp-tutorial
对Word2Vec的模型之一BOW做一点浅显的理解和学习总结。
BOW的原理
BOW的实现
BOW的定位,和其他模型的比较和区分:
skip-grams,cbow https://zh.wikipedia.org/wiki/Word2vec#Skip-grams%E5%92%8CCBOW
另:每次想系统地学习numpy pandas这些库的时候都提醒自己,当务之急是加紧machine learning和natural language processing的学习,库函数是会更迭淘汰的,从Java转到Python就算没有系统地学习语法外的知识,也没有遇到太多阻碍,所以函数现查现用理解参数含义即可,读不懂不会归咎于写得不够多,只是因为数学不够扎实。最终的目的是要在理论的基础上将各个相仿的函数抽象出运算的逻辑从而融会贯通,今后Python也会被淘汰,一个比较讨喜的工具而已,就像algorithm之于code一样,ml和nlp的理论知识才是核心。