CppJieba

CppJieba是C++版本的Jieba中文分词库,提供了在线和离线下载方式。通过jieba.cut()函数进行分词,支持HMM算法。附带词典文件,如dict(utf8编码)、idf(权重信息)和hmm_model(隐式马尔科夫模型)。
摘要由CSDN通过智能技术生成

GitHub地址:https://github.com/yanyiwu/cppjieba

简介

CppJieba是"结巴(Jieba)"中文分词的C++版本

使用方法

在线下载 or 离线下载

git clone https://github.com/yanyiwu/cppjieba.git

头文件

guanhj@guanhj-virtual-machine:~/cppjb/cppjieba$ ls
appveyor.yml  build  ChangeLog.md  CMakeLists.txt  deps  dict  include	README_EN.md  README.md  test
guanhj@guanhj-virtual-machine:~/cppjb/cppjieba$ cd include/
guanhj@guanhj-virtual-machine:~/cppjb/cppjieba/include$ tree
.
└── cppjieba
    ├── DictTrie.hpp
    ├── FullSegment.hpp
    ├── HMMModel.hpp
    ├── HMMSegment.hpp
    ├── Jieba.hpp
    ├── KeywordExtractor.hpp
    ├── limonp
    │   ├── ArgvContext.hpp
    │   ├── BlockingQueue.hpp
    │   ├── BoundedBlockingQueue.hpp
    │   ├── BoundedQueue.hpp
    │   ├── Closure.hpp
    │   ├── Colors.hpp
    │   ├── Condition.hpp
    │   ├── Config.hpp
    │   ├── FileLock.hpp
    │   ├── ForcePublic.hpp
    │   ├── LocalVector.hpp
    │   ├── Logging.hpp
    │   ├── Md5.hpp
    │   ├── MutexLock.hpp
    │   ├── NonCopyable.hpp
    │   ├── StdExtension.hpp
    │   ├── StringUtil.hpp
    │   ├── Thread.hpp
    │   └── ThreadPool.hpp
    ├── MixSegment.hpp
    ├── MPSegment.hpp
    ├── PosTagger.hpp
    ├── PreFilter.hpp
    ├── QuerySegment.hpp
    ├── SegmentBase.hpp
    ├── SegmentTagged.hpp
    ├── TextRankExtractor.hpp
    ├── Trie.hpp
    └── Unicode.hpp

2 directories, 35 files

测试文件

guanhj@guanhj-virtual-machine:~/cppjb/cppjieba$ ls
appveyor.yml  build  ChangeLog.md  CMakeLists.txt  deps  dict  include	README_EN.md  README.md  test
guanhj@guanhj-virtual-machine:~/cppjb/cppjieba$ cd test
guanhj@guanhj-virtual-machine:~/cppjb/cppjieba/test$ ls
CMakeLists.txt	demo.cpp  load_test.cpp  testdata  unittest

demo.cpp

###重要!

1 #include "../include/cppjieba/Jieba.hpp"                                                                                                            
    2 
    3 using namespace std;
    4 
    5 const char* const DICT_PA
cppjieba是一个基于C++的结巴分词库,提供了中文分词的功能。为了在你的系统上使用cppjieba库,你需要按照以下步骤进行编译: 1. **环境准备**: - 确保你的系统上安装了支持C++的编译器,如GCC或者Clang。 - 确保你的系统上安装了CMake构建工具,因为cppjieba使用CMake进行项目管理。 2. **下载cppjieba源码**: - 你可以通过Git克隆cppjieba的仓库: ``` git clone https://github.com/yanyiwu/cppjieba.git ``` - 或者直接下载zip压缩包,然后解压到你的工作目录。 3. **创建编译目录**: - 为了保持源码目录的干净,通常会在源码目录外创建一个新的构建目录: ``` mkdir build && cd build ``` 4. **生成项目文件**: - 使用CMake生成项目文件(根据你的系统和需求,可能需要指定生成特定的IDE项目文件或Makefile): ``` cmake ../cppjieba ``` - 如果需要指定编译器版本,可以在执行`cmake`命令时通过`-DCMAKE_CXX_COMPILER`参数指定: ``` cmake -DCMAKE_CXX_COMPILER=/path/to/g++ ../cppjieba ``` - 如果需要指定特定的构建类型(如Debug或Release),可以使用`-DCMAKE_BUILD_TYPE`参数: ``` cmake -DCMAKE_BUILD_TYPE=Release ../cppjieba ``` 5. **编译cppjieba**: - 使用你系统上的编译工具(如make或相应的IDE工具)来编译项目: ``` make ``` 或者如果你使用的是Visual Studio,可以通过CMake GUI来生成Visual Studio项目文件,然后使用Visual Studio打开并编译。 6. **安装cppjieba**: - 如果编译成功,你还可以使用CMake的`install`命令来安装cppjieba到系统目录: ``` make install ``` 完成以上步骤后,cppjieba库就应该编译安装完毕,并且可以在你的项目中使用了。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值