CppJieba

CppJieba是C++版本的Jieba中文分词库,提供了在线和离线下载方式。通过jieba.cut()函数进行分词,支持HMM算法。附带词典文件,如dict(utf8编码)、idf(权重信息)和hmm_model(隐式马尔科夫模型)。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

GitHub地址:https://github.com/yanyiwu/cppjieba

简介

CppJieba是"结巴(Jieba)"中文分词的C++版本

使用方法

在线下载 or 离线下载

git clone https://github.com/yanyiwu/cppjieba.git

头文件

guanhj@guanhj-virtual-machine:~/cppjb/cppjieba$ ls
appveyor.yml  build  ChangeLog.md  CMakeLists.txt  deps  dict  include	README_EN.md  README.md  test
guanhj@guanhj-virtual-machine:~/cppjb/cppjieba$ cd include/
guanhj@guanhj-virtual-machine:~/cppjb/cppjieba/include$ tree
.
└── cppjieba
    ├── DictTrie.hpp
    ├── FullSegment.hpp
    ├── HMMModel.hpp
    ├── HMMSegment.hpp
    ├── Jieba.hpp
    ├── KeywordExtractor.hpp
    ├── limonp
    │   ├── ArgvContext.hpp
    │   ├── BlockingQueue.hpp
    │   ├── BoundedBlockingQueue.hpp
    │   ├── BoundedQueue.hpp
    │   ├── Closure.hpp
    │   ├── Colors.hpp
    │   ├── Condition.hpp
    │   ├── Config.hpp
    │   ├── FileLock.hpp
    │   ├── ForcePublic.hpp
    │   ├── LocalVector.hpp
    │   ├── Logging.hpp
    │   ├── Md5.hpp
    │   ├── MutexLock.hpp
    │   ├── NonCopyable.hpp
    │   ├── StdExtension.hpp
    │   ├── StringUtil.hpp
    │   ├── Thread.hpp
    │   └── ThreadPool.hpp
    ├── MixSegment.hpp
    ├── MPSegment.hpp
    ├── PosTagger.hpp
    ├── PreFilter.hpp
    ├── QuerySegment.hpp
    ├── SegmentBase.hpp
    ├── SegmentTagged.hpp
    ├── TextRankExtractor.hpp
    ├── Trie.hpp
    └── Unicode.hpp

2 directories, 35 files

测试文件

guanhj@guanhj-virtual-machine:~/cppjb/cppjieba$ ls
appveyor.yml  build  ChangeLog.md  CMakeLists.txt  deps  dict  include	README_EN.md  README.md  test
guanhj@guanhj-virtual-machine:~/cppjb/cppjieba$ cd test
guanhj@guanhj-virtual-machine:~/cppjb/cppjieba/test$ ls
CMakeLists.txt	demo.cpp  load_test.cpp  testdata  unittest

demo.cpp

###重要!

1 #include "../include/cppjieba/Jieba.hpp"                                                                                                            
    2 
    3 using namespace std;
    4 
    5 const char* const DICT_PA
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值