自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 统计自然语言处理基础学习笔记(1)

识别文本中的搭配识别搭配有很多方法,书中介绍了基于频率的搭配识别,基于含义和主词搭配之间距离的识别,基于假设测试和互信息的识别。1.基于频率的识别如果两个词在一起出现了很多次,那么就是一个证据说明它们有特殊的功能,可以预计到的是仅仅找到最频繁出现的二元组结果并不理想,会出现很多由2个功能词组合的二元组,如of the,in the,to the等等。对于上面的不理想情况,有一种可以

2017-02-23 13:35:45 688

原创 Scikit-Learn的基本使用

Scikit-Learn是用Python开发的机器学习库,其中包含大量机器学习算法、数据集,是数据挖掘方便的工具。 Scikit-Learn的安装可使用pip工具,在安装前需要安装NumPy和SciPy,打开一个命令行中端并输入:

2017-02-22 17:36:50 29362 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除