
LanguageTool
柳鲲鹏
建立了编程学(编程基本功、平台化编程)、六石管理学等几个流派。
每涉及一个领域,都是顶级砖家。在这些领域中,如果遇到问题,最后肯定是搜索到本博客。
展开
-
LanguageTool精简的两个思路
LanguageTool内容太多,对于我们来说,是用不着的。精简语言目录下的pom.xml,有很多语言。对于我们来说,可以只保留en/zh,其他的注释掉。精简规则比如英文,可以修改如下文件,去掉多余的规则:languagetool-language-modules/en/src/main/java/org/languagetool/language/English.java...原创 2021-11-24 11:05:26 · 607 阅读 · 0 评论 -
LanguageTool默认有4万多的拼写检查需要忽略的词
最近做到忽略功能,加了两个单词进去,想看一下列表。结果看到显示,心里奇怪了(大量的数组)。今天输出了一下。代码是: for (Rule rule : langTool.getAllActiveRules()) { if (rule instanceof SpellingCheckRule) { SpellingCheckRule check = (SpellingCheckRule)rule; List<String>原创 2021-11-19 13:26:34 · 502 阅读 · 0 评论 -
LanguageTool性能简单测试分析
代码参考:LanguageTool最简范例代码_柳鲲鹏-CSDN博客真的好慢啊。吾机器性能还是非常好的。初始化约0.8秒。JLanguageTool langTool = new JLanguageTool(new BritishEnglish());其中0.5秒花在加载grammar.xml上。每次检查要1.3秒这个速度让吾意外。什么地方要消耗这么多的时间?简单跟踪了一下,时间花在getTextLevelRuleMatches()上。 试着去掉grammar.xml,对检查没原创 2021-10-19 13:29:32 · 396 阅读 · 0 评论 -
LINUX下载编译:segment.jar/net.loomchild.segment.srx.Srx2SaxParser
查了半天,终于找到了:https://github.com/loomchild/segment原创 2021-10-18 14:32:32 · 238 阅读 · 0 评论 -
全网首发:跟踪分析This parser does not support specification “null“ version “null“
详细错误:Caused by: java.lang.UnsupportedOperationException: This parser does not support specification "null" version "null" at javax.xml.parsers.SAXParserFactory.setSchema(SAXParserFactory.java:394) at net.loomchild.segment.srx.io.Srx2SaxParser.<init原创 2021-10-18 10:32:23 · 465 阅读 · 0 评论 -
LanguageTool至少需要哪些jar包?
按照范例:LanguageTool最简范例代码_柳鲲鹏-CSDN博客英文:language-en-5.5-SNAPSHOT.jarlanguage-zh-5.5-SNAPSHOT.jarlanguagetool-tools-5.5-SNAPSHOT-jar-with-dependencies.jaropennlp-chunk-models.jaropennlp-postag-models.jaropennlp-tokenize-models.jaropennlp-tools.jar原创 2021-10-18 09:55:20 · 547 阅读 · 0 评论 -
LanguageTool最简范例代码
说明中有这些代码。如果能搜索到这个博文也行:package taishan.languagetool;import java.io.IOException;import java.util.Arrays;import java.util.List;import javax.swing.JFrame;import org.languagetool.JLanguageTool;import org.languagetool.language.BritishEnglish;impor原创 2021-10-18 09:48:21 · 1143 阅读 · 0 评论 -
Could not initialize English chunker/Could not load file from classpath: ‘/en-token.bin‘
具体错误:java.lang.RuntimeException: Could not initialize English chunker at org.languagetool.chunking.EnglishChunker.<init>(EnglishChunker.java:72) at org.languagetool.language.English.createDefaultChunker(English.java:123) at org.languagetool.Lan原创 2021-09-30 15:13:18 · 256 阅读 · 0 评论 -
LINUX下载编译LanguageTool
这是一个开源的语法检查工具。下载git clone --depth 5 https://github.com/languagetool-org/languagetool.git如果是下载解压方式,在执行mvn时会报错。解压(略) 编译# 会自行下载需要的库mvn clean test./build.sh languagetool-standalone package -DskipTests结果很多jar,具体哪些测试通过后再说。...原创 2021-09-28 17:33:53 · 369 阅读 · 0 评论