庖丁分词
奔跑的蜗牛2015
IT码农
展开
-
庖丁优化,ac算法
目前关键词敏感词改造后是部署在一起的,暂时有三台服务器,敏感词大约有900条数据,关键词大概有35W数据, 敏感词部分有自动更新机制,每天更一次,从数据库中查询,这个如果后面数量变大,可以考虑不进行每天更新,目前词汇数目小没有什么影响。敏感词部分目前是去掉空格匹配敏感词,用的是AC算法。 AC算法思想:用多模式串建立一个确定性的树形有限状态机,以主串作为该有限状态机的输入,使状态机进行原创 2017-10-23 18:05:51 · 587 阅读 · 0 评论 -
springboot + dubbo +mybaits实践
写在开头:以前做过一些springboot项目,里面有已经配置好的springboot+mybaits配置,想拿过来直接用。 准备阶段,先下载了一个dubbo的demo,然后本地搭建了一个简单的dubbo,zk dubboadmin provide consumer都是在本地的,能在admin中看到服务提供者和消费者,哈哈哈,以为这样就可以了。 坑一,当想将以前的一个spri...原创 2018-06-16 13:53:04 · 435 阅读 · 0 评论