![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
kashgari
wxl781227
生命如昙花一现,愿每一段行程象如歌的行板,灿烂而又真实!
展开
-
文本分类(ALBert+BiLSTM)
基于ALBert及BiLSTM进行中文文本分类的通用过程。1.语料准备(基于csv文件),语料类import osfrom typing import Listfrom typing import Tupleimport numpy as npimport pandas as pdfrom tensorflow.keras.utils import get_filefrom kashgari import macros as Kfrom kashgari import uti..原创 2021-09-29 11:52:29 · 1557 阅读 · 5 评论 -
领域命名实体NER实现:Bert+BiLSTM+CRF
以前通过模板规则的方式进行命名实体的提取,优点是提取速度非常高,但模板规则存在冲突的情况,尝试过使用百度LAC通过词性模板规则进行命名实体的提取,好处是少量规则可以覆盖大部分情况,但也存在规则冲突的情况。本文尝试采用Bert+BiLSTM+CRF的方式进行命名实体的提取。使用Bert的好处是能够学习到语料的语义特征,BiLSTM能学习到词之间较长的上下文关系,CRF能纠正BiLSTM预测的顺序错误。Bert的好处是准确率非常高,缺点也很明显,推理速度低,可以通过部署的方式来提升推理性能,如:使用ONNX..原创 2021-05-08 10:00:10 · 2436 阅读 · 6 评论