自然语言处理
程裕强
开源是人类最大的公益事业!--程裕强
展开
-
自然语言处理:基于PCFG的中文句法分析样例
1、下载https://nlp.stanford.edu/software/lex-parser.shtml#Download解压缩复制stanford-parser.jar和stanford-parser-3.9.2-models.jar到python程序文件同目录下2、python程序#coding=utf-8# 分词import jieba# PCFG句法分析fr...原创 2019-11-05 09:26:32 · 2364 阅读 · 4 评论 -
SpringBoot 2.x整合IKAnalyzer中文分词
废话不多说,直接上代码。1、pom.xml <dependency> <groupId>com.janeluo</groupId> <artifactId>ikanalyzer</artifactId> <version>2012_u6</ve...原创 2019-10-29 09:34:07 · 5392 阅读 · 2 评论 -
自然语言处理:日期识别
#日期识别# 模块:所谓模块就是一个.py文件,用来存放变量,方法的文件# 包(package): 包是更大的组织单位,用来组织区别管理多个模块文件# import 模块 [as 别名模块]# import 包.[N包].模块# import 导入 最后一个必须是模块,而不能以包结尾# from 包.[..包] import 模块# from 包.模块 import 方法#...原创 2019-10-28 09:59:58 · 2235 阅读 · 0 评论 -
中文分词算法:逆向最大匹配法
1、词典./data/rmm_dic.utf8南京市南京市长长江大桥人民解放军大桥2、RMM算法#逆向最大匹配class RMM(object): def __init__(self, dic_path): self.dictionary = set() self.maximum = 0 #读取词典 wit...原创 2019-10-24 11:32:27 · 2095 阅读 · 0 评论