Node.JS 中文分词模块

最新推荐文章于 2024-05-11 10:05:40 发布

混沌极致

最新推荐文章于 2024-05-11 10:05:40 发布

阅读量7.1k

点赞数

分类专栏： solr-sphinx-coreseek

本文链接：https://blog.csdn.net/marujunyy/article/details/8466297

版权

solr-sphinx-coreseek 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

mmseg-node

一个基于 libmmseg 的 NodeJS 驱动。

使用方法

var mmseg = require("mmseg");
var q = mmseg.open('/usr/local/etc/');
console.log(q.segmentSync("我是中文分词"));

Github 地址

https://github.com/zzdhidden/mmseg-node

nseg

基于 MMSG 中文分词算法。

示例

var dict  = require('../data/dict'),
    freq  = require('../data/freq'),
    date  = require('../lex/datetime'),
    sina  = require('../lex/sina');

var opts  = {
        dict: dict,
        freq: freq,
        lexers: [date, sina],
    };

var nseg = require('nseg').evented(opts);

var strmOut = fs.createWriteStream(target, {flags: 'w+', encoding: 'utf-8'}),
    strmIn  = fs.createReadStream(input);

var pipe = nseg(strmIn, strmOut);
pipe.on('error', function (err) {
    console.log('error', err);
});

pipe.start();

var dict  = require('../data/dict'),
    freq  = require('../data/freq'),
    date  = require('../lex/datetime'),
    sina  = require('../lex/sina');

var opts  = {
        dict: dict,
        freq: freq,
        lexers: [date, sina],
    };

var nseg = require('nseg').normal(opts);

nseg('研究生源计划', function (result) {
    console.log(result);
});

Github 地址

https://github.com/mountain/nseg

node-segment

node-segment 模块以盘古分词组件中的词库为基础，算法设计也部分参考了盘古分词组件中的算法。

使用方法

// 载入模块
var Segment = require('node-segment').Segment;
// 创建实例
var segment = new Segment();
// 使用默认的识别模块及字典
segment.useDefault();
// 开始分词
console.log(segment.doSegment('这是一个基于Node.js的中文分词模块。'));

Github 地址

https://github.com/leizongmin/node-segment

混沌极致

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
Node.JS 中文分词模块

mmseg-node一个基于 libmmseg 的 NodeJS 驱动。使用方法 var mmseg = require("mmseg");var q = mmseg.open('/usr/local/etc/');console.log(q.segmentSync("我是中文分词"));Github 地址 https://github.com/zzdh
复制链接

扫一扫