自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 资源 (7)
  • 问答 (4)
  • 收藏
  • 关注

原创 stanford-segmenter中文分词基本使用

stanford-segmenter中文分词基本使用

2017-01-25 20:44:10 7371

翻译 Stanford NER CRF FAQ

原网页http://nlp.stanford.edu/software/crf-faq.html 的翻译Stanford NER常见问题

2017-01-25 18:51:06 2682

翻译 斯坦福命名实体识别(Stanford Named Entity Recognizer)

Stanford Named Entity Recognizer

2017-01-24 20:40:13 13046

原创 ubuntu下安装Spark(单机环境)

ubuntu中安装spark

2017-01-20 20:34:02 6252

原创 ubuntu及windows下工具

ubuntu及Windows下的软件工具集锦

2017-01-20 16:43:50 328

原创 用python发送邮件

python3,用smtp协议发送邮件

2017-01-09 17:21:30 360

原创 LibreOffice Calc求和操作

ubuntu的LibreOffice,对某一列快速求和

2017-01-07 16:04:03 12424

原创 windows环境下安装selenium

windows环境中安装selenium,一些基本步骤以及需要注意的细节等

2017-01-06 13:30:54 74209 7

原创 selenium学习笔记(二)

用selenium来代替手工操作浏览器。自动化方式。此份笔记是在自学过程中的一点一滴的记录。

2017-01-04 19:31:51 1238

原创 selenium学习笔记(一)

安装phantomjs,selenium,准备结合python3进行爬虫的学习笔记

2017-01-03 11:57:23 6193

维基百科中文语料word2vec训练后结果

中文维基百科语料库,将其转换为文本文件后,进行繁体字转换为简体字,字符集转换,分词,然后训练得到模型以及向量。由于文件上传的大小限制是60MB,而训练后的所有文件大小有1G以上,所以这里只提供了下载链接,地址在网盘中。使用python中的gensim包进行训练得到的,运行时间较长,纯粹的维基百科中文语料训练后的结果,拿去可以直接使用。

2017-06-03

Stanford typed dependencies manual

Revised for the Stanford Parser v. 3.7.0 in September 2016 Stanford parser的类型依赖说明

2017-02-27

java自然语言处理英文

使用java进行自然语言处理,电子书。pdf文字版,不是扫描版。

2017-02-26

wiki.zh.text.model

中文维基百科语料库,将其转换为文本文件后,进行繁体字转换为简体字,字符集转换,分词,然后训练得到模型以及向量。由于文件上传的大小限制是60MB,我这里的压缩包中有model,然后对向量提供了下载链接。使用python中的gensim包进行训练得到的,运行时间较长,希望对你们有帮助。

2017-02-23

phantomjs-2.1.1-linux-x86_64.tar.bz2

ubuntu(或者linux)平台上安装phantomjs。这是从官网上下载的。

2017-01-03

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除