- 博客(2)
- 收藏
- 关注
原创 统计自然语言处理基础学习笔记(1)
识别文本中的搭配识别搭配有很多方法,书中介绍了基于频率的搭配识别,基于含义和主词搭配之间距离的识别,基于假设测试和互信息的识别。1.基于频率的识别如果两个词在一起出现了很多次,那么就是一个证据说明它们有特殊的功能,可以预计到的是仅仅找到最频繁出现的二元组结果并不理想,会出现很多由2个功能词组合的二元组,如of the,in the,to the等等。对于上面的不理想情况,有一种可以
2017-02-23 13:35:45 693
原创 Scikit-Learn的基本使用
Scikit-Learn是用Python开发的机器学习库,其中包含大量机器学习算法、数据集,是数据挖掘方便的工具。 Scikit-Learn的安装可使用pip工具,在安装前需要安装NumPy和SciPy,打开一个命令行中端并输入:
2017-02-22 17:36:50 29386 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人