自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 资源 (1)
  • 收藏
  • 关注

转载 最大熵模型

最大熵模型介绍及实现最大熵NLP自然语言处理Overview统计建模方法是用来modeling随机过程行为的。在构造模型时,通常供我们使用的是随机过程的采样,也就是训练数据。这些样本所具有的知识(较少),事实上,不能完整地反映整个随机过程的状态。建模的目的,就是将这些不完整的知识转化成简洁但准确的模型。我们可以用这个模型去预测随机过程未来的行为。在统计建模这个领域,指数模型被证明是非常好用的。因此,

2015-07-30 10:53:01 542

原创 朴素贝叶斯

基于概率论的分类方法:朴素贝叶斯最近在学朴素贝叶斯,主要是看统计学习方法与机器学习实战这两本书。 在学习朴素贝叶斯之前,读者需要先复习一下概率论里的相关知识。朴素贝叶斯的学习与分类1、基本方法 2、后验概率最大化的含义朴素贝叶斯法的参数估计1、极大似然估计 2、学习与分类算法 3、贝叶斯估计具体内容请读者阅读《统计学习方法》在《机器学习实战》一书中,具体讲解了朴素贝叶斯分类的案例与具体实现代

2015-07-26 22:06:29 464

原创 python scrapy

scrapy入门教程一直想用python进行爬虫,无意间接触了scrapy。scrapy简介Scrapy,Python开发的一个快速,高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试。 Scrapy吸引人的地方在于它是一个框架,任何人都可以根据需求方便的修改。它也提供了多种类型爬虫的基类,如BaseSpider

2015-07-23 10:08:42 541

转载 中文情感分析

利用python snownlp组件进行中文情感分析SnowNLP是一个python写的类库,可以方便的处理中文文本内容。可以进行转换成拼音,繁体转简体,提取文本关键词(Textrank算法),提取文本摘要(Textrank算法),在这些方面很有用。 官方网站:http://t.cn/8kf1c3pSnowNLP: Simplified Chinese Text ProcessingSnowNLP

2015-07-22 17:13:40 2167

转载 自然语言处理的中文分词方法

中文分词方法平台:win7,python,vs20101、CRF++CRF++是著名的条件随机场开源工具,也是目前综合性能最佳的CRF工具。 一、工具包的下载: 其中有两种,一种是Linux下(带源码)的,一种是win32的,下载 http://download.csdn.net/source/1425683将这两种版本打成一个包了。 二、安装: a) Windows版的

2015-07-17 22:05:27 4199

原创 easy_install安装第三方包出现的问题

easy_install 报错:Microsoft Visual C++ 9.0 is required Unable to find vcvarsall.bat有时候,在Windows7x64下使用easy_install安装包的时候提示报错:Microsoft Visual C++ 9.0 is required (Unable to find vcvarsall.bat)环境:windows7

2015-07-17 15:43:57 754

原创 windows下用swig实现python调用C\C++的方法

windows下用swig实现python调用C\C++的方法本文技术平台:win7,vs2010,python2.7(64位)1.下载swig在[www.swig.org]官网上下载相应的安装包,下载后解压安装包到任意路径,注意:路径中最好不要带空格。这样swig便可以使用2.c++源文件和swig接口文件,文件如下:example.h/* example.h */#ifndef EXAMPLE

2015-07-16 10:56:31 2041

CRF++ windows版本

crf++可用于进行序列标注,中文分词,中文文本分类等功能

2015-08-19

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除