1-IPartitionTokenScanner 与 ITokenScanner 的区别
ITokenScanner 是扫描类的最底层接口,IPartitionTokenScanner 继承ITokenScanner ,额外提供了从一个分区的半中间开始解析的功能,暂时了解到的扫描器都是基于rule的,RuleBasedPartitionScanner 仍然是基于rule的扫描器,只不过是添加了从区块半中间开始解析的功能
2- 要实现自己的区块扫描器 可以继承 RuleBasedPartitionScanner ,然后再setPredicateRules中添加自己定义的Rule,并且要自定义这些token的名称,根据这些名称,可以判断Rule的类型
3- 所以要解析我们的文档,还是创建我们自定义的Rule的,如何创建自己的Rule呢?首先,jface为我们提供了好多默认实现的基础类,我们可以根据要划分的文本类型来选择对应的Rule基类,比如如果要划分的规则是多行的,那么就可以选择MultiLineRule,等等,至于这些默认的Rule的总结,可以参考其他的相关笔记