目录
3.2.1自然语言处理包(NLTK)
0、引言
(1)背景
重点介绍的Scikit-learn几乎囊括了所有机器学习领域的经典模型。掌握这些模型对于初学者来讲是十分必要的。然而,许多从业者却更加热衷于那些尽管描述复杂但是功能强大、性能强劲的新模型,教科书中的经典显然无法满足他们的胃口。机器学习方法之所以能够在短短十几年间成为计算机科学领域炙手可热的研究话题,并且广泛应用于现实生活中的方方面面,很大程度上受惠于其极高的成果转化率。大量描述新模型的论文已经发表,便会立刻被各大业界公司、科研机构所关注。一旦这些新模型被证明可以为商业系统取得更高的性能、获得更多的盈利,那么就会有编程爱好者参与进来从事开源代码的开发,甚至有些被封装为工具包供给更多的人使用。
列举几个比较成功的案例:用于自然语言(文本)处理的工具包NLTK;量化词汇语义相似度的词向量(Word2Vec)技术;比许多经典集成模型的性能表现更加强劲的XGBoost;甚至Google最新发布的深度学习框架TensorFlow。
(2)Mac OS配置步骤
略。
(3)Windows配置步骤
①安装Anaconda。
具体安装Anaconda的方法参照https://blog.csdn.net/wyatt007/article/details/80369755。
②安装TensorFlow。
具体安装TensorFlow的方法参照https://blog.csdn.net/wyatt007/article/details/1058