【*项目调研+论文阅读】SVM-BILSTM-CRF模型SVM-BILSTM-CRF模型 | day7

《基于SVM-BILSTM-CRF模型的财产纠纷命名实体识别方法》2018-《计算机系统应用》


SVM 筛选出包含关键命名实体的句子
句子转化为字符级向量作为输入
构建适合财产纠纷领域的BiLSTM -CRF 深层神经网络模型

一、SVM-BiLSTM-CRF 模型

在这里插入图片描述

1.SVM

  查询词向量表,将语句转换成相应的词向量序列。输入 SVM 判断。 如果不含财产实体, 则将所有的字标记为 O, 否则查询字符向量表,获得相应的字符向量序列。

  (1)由于包含财产实体的句子占案件描述句子的比重不高。 使用 SVM 将无用的句子直接筛除。获得训练样本。
  (2)将训练样本经过分词, 去停用词,在不影响分类精度的情况下利用 tf-idf 进行特征降维形成词向量表{w1,w2,…,wn}, n=特征维度。 对于一个句子S i = {w′1,w′2,…,w′m} , m=句子长度, 经过词向量表处理, 形成一个特征向量{x′1, x′2,…, x′n} , 利用核函数φ与标签yi一起加入构成线性不可分问题方程。 使用SMO算法解决该线性不可分的线性支持向量机问题。

2.Bi-LSTM

  符向量序列输入 BiLSTM 进行实体识别。

3.CRF

  CRF 模块将 BiLSTM 的输出进行处理得出一个最优的标记序列。
由于单独使用 BiLSTM 生成的结果可能在标注序列并不是全局最优。通过CRF分析相邻标签的关系以获得一个全局最优的标记序列。

二、实验

1.构建数据集

  中国裁判文书网下载的财产纠纷裁判文书。适当的数据预处理,手工标注后构建财产纠纷的语料库。一半作为训练集,一半作为测试集。
在这里插入图片描述

2.寻找触发词

  有意义的命名实体存在于查明的事实和证据中。
  事实往往以:“经审理查明”, “经审理认定”, “经开庭审理查明”, “经开庭审理认定”, “审理中查明”, “审理中认定”, “确定如下事实”,“认定如下事实”, “认定以下事实”, “查明如下事实”,“查明以下事实”, “本案事实如下”, “查明事实如下”,“确定事实如下”等作为起始句。
  上述可作为“触发词”使用。将事实提取出来进行分句、分词、去停用词等处理。

3.构建适用于财产纠纷的四词位法

  词是由一个或多个字组成的。 例如: “现金”是两字词, “上轿礼”是三字词。
  组成词语的每一个汉字在一个特定的词语中都占据一个特定的构词位置, 即词位。
  词位的种类根据研究的需要可以自行定义。
  在已有的工作中常用的有四词位标注集 (B、M、E、S) 和六词位标注集 (B、B1、B2、M、 E、S)。
  针对财产纠纷,使用四词位集。用 B 表示词的开始, M 表示词的中部, E 表示词的结尾, O 表示其他非财产的字, 并结合财产类别进行标注。(财产类别分为四类)
在这里插入图片描述

<p> 本课程<span>隶属于自然语言处理</span>(NLP)<span>实战系列。自然语言处理</span>(NLP)<span>是数据科学里的一个分支,它的主要覆盖的内容是:以一种智能与高效的方式,对文本数据进行系统化分析、理解与信息提取的过程。通过使用</span>NLP以及它的组件,我们可以管理非常大块的文本数据,或者执行大量的自动化任务,并且解决各式各样的问题,如自动摘要,机器翻译,命名实体识别,关系提取,情感分析,语音识别,以及主题分割等等。 </p> <p> <span>一般情况下一个初级</span>NLP工程师的工资从15<span>万</span>-35<span>万不等,所以掌握</span>NLP技术,对于人工智能学习者来讲是非常关键的一个环节。 </p> <p> <br /> </p> <p> <br /> </p> <p> <span style="background-color:#FFE500;">超实用课程内容</span> </p> <p> <span>课程从自然语言处理的基本概念与基本任务出发,对目前主流的自然语言处理应用进行全面细致的讲解,</span><span>包括文本分类,文本摘要提取,文本相似度,文本情感分析,文本特征提取等,同时算法方面包括经典算法与深度学习算法的结合,例如</span><span>LSTM,BiLSTM等,并结合京东电商评论分类、豆瓣电影摘要提取、今日头条舆情挖掘、饿了么情感分析等过个案例,帮助大家熟悉自然语言处理工程师在工作中会接触到的</span><span>常见应用的实施的基本实施流程,从</span><span>0-1入门变成自然语言处理研发工程师。</span> </p> <p style="color:#3A4151;font-size:14px;background-color:#FFFFFF;"> <br /> </p> <p style="color:#3A4151;font-size:14px;background-color:#FFFFFF;"> <span style="background-color:#FFE500;">课程如何观看?</span> </p> <p style="color:#3A4151;font-size:14px;background-color:#FFFFFF;"> PC端:<a href="https://edu.csdn.net/course/detail/26277"></a><a href="https://edu.csdn.net/course/detail/25649">https://edu.csdn.net/course/detail/25649</a> </p> <p style="color:#3A4151;font-size:14px;background-color:#FFFFFF;"> 移动端:CSDN 学院APP(注意不是CSDN APP哦) </p> <p style="color:#3A4151;font-size:14px;background-color:#FFFFFF;"> 本课程为录播课,课程2年有效观看时长,大家可以抓紧时间学习后一起讨论哦~ </p> <p> <br /> </p> <p> <strong><span style="background-color:#FFE500;">学员专</span><span style="background-color:#FFE500;">享增值服务</span></strong> </p> <p> 源码开放 </p> <p> 课件、课程案例代码完全开放给你,你可以根据所学知识,自行修改、优化 </p> <p> 下载方式:电脑登录<a href="https://edu.csdn.net/course/detail/26277"></a><a href="https://edu.csdn.net/course/detail/25649">https://edu.csdn.net/course/detail/25649</a>,点击右下方课程资料、代码、课件等打包下载 </p> <p> <br /> </p> <p> 通过第二课时下载材料<span></span> </p> <p> <br /> </p> <p> <br /> </p>
评论 1 您还未登录,请先 登录 后发表或查看评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
©️2022 CSDN 皮肤主题:深蓝海洋 设计师:CSDN官方博客 返回首页

打赏作者

潮一

你的鼓励将是我创作的最大动力

¥2 ¥4 ¥6 ¥10 ¥20
输入1-500的整数
余额支付 (余额:-- )
扫码支付
扫码支付:¥2
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值