- 博客(2)
- 资源 (1)
- 收藏
- 关注
原创 solr spellcheck 距离选取方案
spellcheck本质上工作机制是两步: 1. ngram进行候选检索 2. 选取ngram打分最高的几个,进行距离计算,如果距离大于solrconfig中的accuracy配置项,就返回该纠错结果 之前沿用了默认配置项编辑距离, str name="distanceMeasure">org.apache.lucene.search.spell.LevensteinDistan
2017-06-16 17:41:11 762
原创 批量车源解析方案
车商批量资源发布解决方案背景车商发布资源门槛较高,手里的资源想全部转化为平台上的规范资源需要一条一条发布,比较繁琐,但是车商会天天在朋友圈、微信群里发布他们用自然语言“编写”的资源,例如:X1/286000 白,蓝,红,粽⬇14.5点 GT320/398000 矿白黑 ⬇16.5点 525/499600 矿白摩卡 ⬇18.5点 ☎18521707911 全部上海提,店车店票 如果
2017-06-12 21:35:13 799
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人