NLP面筋-平安

1、分词方法

  • HMM
  • CRF
  • BERT-BiLSTM-CRF

常有分词器

中科院计算所NLPIR http://ictclas.nlpir.org/nlpir/

ansj分词器 https://github.com/NLPchina/ansj_seg

哈工大的LTP https://github.com/HIT-SCIR/ltp

清华大学THULAC https://github.com/thunlp/THULAC

斯坦福分词器 https://nlp.stanford.edu/software/segmenter.shtml

Hanlp分词器 https://github.com/hankcs/HanLP

结巴分词 https://github.com/yanyiwu/cppjieba

KCWS分词器(字嵌入+Bi-LSTM+CRF) https://github.com/koth/kcws

ZPar https://github.com/frcchang/zpar/releases

IKAnalyzer https://github.com/wks/ik-analyzer

2、文本相似度

  •   编辑距离
  •  两句子词向量的余弦相似性
  •  BLEU
  • ROUGE

3、最长公共子序列LCS

 动态规划:https://blog.csdn.net/hrn1216/article/details/51534607

4、有1w个敏感词,怎么过滤

前缀树:https://blog.csdn.net/weixin_39778570/article/details/81990417

5、有一个8升装满水的杯子,还有一个3升和5升的空杯子,怎么倒出一个4升水。

索引|杯子853
初始化800
1350
2323
3620
4602
5152
6143

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值