![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
nlp工具
tsf_1993
自然语言处理,数据挖掘,机器学习
展开
-
crfsuit安装
安装包 liblbfgs-1.10.tar.gz 一个有限内存Broyden-Fletcher-Goldfarb-Shanno函数半二次优化工具,可以用来进行求解函数最优值。 crfsuite-0.12.tar.gz 命令$ tar -zxvf crfsuite-0.12.tar.gz$ tar -zxvf liblbfgs-1.10.tar.gz$ cd liblbfgs-1.10翻译 2015-09-16 09:06:37 · 1470 阅读 · 0 评论 -
python下libsvm的使用
python下libsvm的使用LibSVM (http://www.csie.ntu.edu.tw/~cjlin/libsvm)使用LibSVM的一些准备工作 平台 • Win32+python+pnuplot • Linux+python+pnuplot 数据 • Training Set • Test Set SVM基础知识样本文件格式每行格式:label feature1:翻译 2015-09-18 21:38:07 · 2887 阅读 · 0 评论 -
crf++-0.58java调用
import java.io.File;public class crf { static crf crf; private crf(){ } public static crf getInstance(){ if(crf==null){ crf=new crf(); } return crf; } public void原创 2015-09-22 13:40:15 · 2118 阅读 · 0 评论 -
libsvm java调用
1. 调用docpublic class Libsvm { static Libsvm libsvm; private Libsvm() { } public static Libsvm getInstance() { if (libsvm == null) { libsvm = new Libsvm(); }原创 2015-09-22 14:11:52 · 1268 阅读 · 0 评论 -
word2vec训练参数说明
训练命令:./word2vec -train text8 -output vectors.bin -cbow 1 -size 200 -window 8 -negative 25 -hs 0 -sample 1e-4 -threads 20 -binary 0 -iter 15./distance vectors.bin中的text8更改成自己的训练数据名称all_words,如果你的数据有后缀,转载 2015-09-22 14:36:59 · 11662 阅读 · 6 评论 -
word2vec注释
1、多线程并行处理:1、分配内存空间,创建多线程,执行多线程。malloc,pthread_create,pthread_join 2、每个多线程处理的训练文档根据线程id,分配不同的文档内容,由fseek定位2、vocab相关:1、每个vocab对象都含以下内容:词(char[]),词频(long long),词在哈夫曼树中的父节点们(可以理解为编码的次序)(int*),哈夫曼编码(char*转载 2015-09-22 14:26:08 · 1511 阅读 · 0 评论 -
crf++-0.58用于分词
准备1.下载crf++-0.58 2.训练数据train.txt 3.template 文件 4.测试数据test.txt 本文之讲述简单的操作步骤,具体使用时的template设计,训练命令参数选择。。。。。。。train.txt文件数据格式:template文件test.txt 文件数据格式训练命令: crf_learn template train.txt model 命令执原创 2015-09-18 20:21:46 · 2986 阅读 · 0 评论