- 博客(2)
- 资源 (8)
- 收藏
- 关注
原创 python3打开pkl文件
python中带有pickle包对pkl文件进行操作。 打开带有中文的pkl文件,需要指定编码格式:import pickle# f = open('dict_word.pkl', 'rb')# for line in f:# print(line)dict_word = pickle.load(open("dict_word.pkl", 'rb'), encoding='utf-8
2017-10-30 12:06:28 29771 3
nlp-lang-1.7.jar
ansj是由孙健开发的一个基于n-Gram+CRF+HMM的中文分词的java实现。分词速度达到每秒钟大约200万字左右(mac air下测试),准确率能达到96%以上。目前实现了:中文分词、中文姓名识别、用户自定义词典、关键字提取、自动摘要、关键字标记等功能。可以应用到自然语言处理等方面,适用于对分词效果要求高的各种项目。作者在最新的分词方式里增加了基于深度学习的分词方式。
2017-09-04
tree_split-1.5
ansj是由孙健开发的一个基于n-Gram+CRF+HMM的中文分词的java实现。分词速度达到每秒钟大约200万字左右(mac air下测试),准确率能达到96%以上。目前实现了:中文分词、中文姓名识别、用户自定义词典、关键字提取、自动摘要、关键字标记等功能。可以应用到自然语言处理等方面,适用于对分词效果要求高的各种项目。作者在最新的分词方式里增加了基于深度学习的分词方式。
2017-09-04
ansj_seg-5.1.3.jar
最新的ansj分词工具jar包,用于在ecplise中使用ansj分词。ansj是由孙健开发的一个基于n-Gram+CRF+HMM的中文分词的java实现。分词速度达到每秒钟大约200万字左右(mac air下测试),准确率能达到96%以上。目前实现了:中文分词、中文姓名识别、用户自定义词典、关键字提取、自动摘要、关键字标记等功能。可以应用到自然语言处理等方面,适用于对分词效果要求高的各种项目。作者在最新的分词方式里增加了基于深度学习的分词方式。
2017-09-04
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人