结合案件要素序列的罪名预测方法-CSDN博客

本文链接：https://blog.csdn.net/weixin_45585364/article/details/121759719

本文提出了一种结合案件要素序列的罪名预测方法，利用图卷积神经网络和文本语义表示，提高罪名预测的准确性。实验表明，这种方法在易混淆罪名的区分上表现出色，相比传统方法有显著优势。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

点击上方蓝字关注我们

结合案件要素序列的罪名预测方法

孙倩¹, 秦永彬^1,2, 黄瑞章^1,2, 刘丽娟³, 陈艳平^1,2

1 贵州大学计算机科学与技术学院，贵州贵阳 550025

2 公共大数据国家重点实验室，贵州贵阳 550025

3 贵州师范学院，贵州贵阳 550018

摘要：罪名预测指根据给定的案情事实找到适用罪名。现有罪名预测方法主要使用文本内容进行分类，但无法有效地利用文本中的案件要素。针对现有方法的不足，提出了一种结合案件要素序列的罪名预测方法。该方法将案情事实过程表示为一系列以“行为”为核心且具有时序关系的案件要素序列，然后利用图卷积神经网络进行表示，最后融合文本语义特征来预测案件罪名。实验表明，该方法比现有方法具有更好的预测性能。同时，该方法在对易混淆罪名的区分方面也有较好的表现。

关键词：案情事实 ; 图卷积神经网络 ; 案件要素 ; 文本分类

论文引用格式：

孙倩, 秦永彬, 黄瑞章, 等. 结合案件要素序列的罪名预测方法[J]. 大数据, 2021, 7(6): 30-40.

SUN Q, QIN Y B, HUANG R Z, et al. Charge prediction method combined with case elements sequence[J].BigDataResearch,2021,7(6):30-40.

1 引言

随着智能司法建设的稳固推进，人工智能技术逐渐渗透到法院审判工作中。法律查询、信息检索等智能辅助办案功能被不断地探索和实践，极大地促进了审判体系的现代化。当前，法院在长期的司法实践中积累了大量的裁判文书，裁判文书是法院的审理过程和结果的载体，其中蕴含了重要的案情信息和隐藏的知识价值。利用裁判文书的案情事实部分，发现隐含的特征信息，是支撑智慧法院辅助办案的核心，是提升法院工作效率和保障司法公平的重要途径。

罪名预测是智能司法辅助办案中的重要任务。在具体的司法实践中，法官通常从案情事实出发，依据案情特征及其逻辑关系进行判定。在此过程中，案件要素发挥了重要作用。案件要素是指案情事实描述中的关键行为词及与行为相关的要素。

案例1故意杀人罪：“XX市人民检察院指控，被告人党某在家中因生活琐事与其婆婆吴某发生争执，在争吵与打斗过程中，党某持砖头击打吴某头部，致其当场死亡。”

案例2抢劫罪：“XX市人民检察院指控，被告人王某某窜至X市X区X路X超市门口，持刀对被害人段某某进行威胁，从段某某包内抢走现金400余元后，逃至X小区旁一网吧内，王某某在网吧内被公安民警抓获。”

案例1和案例2分别是故意杀人罪和抢劫罪的案情事实部分。案例1是由于双方发生争执，行为人党某故意使用凶器击打被害人吴某头部，导致被害人吴某死亡。案例2是由于行为人王某某单方面原因，持刀威胁被害人并抢走财物。两个案例在犯罪起因和经过、适用罪名、包含案件要素等方面均不同。由此可见，案件要素的获取可以实现案情事实和判决结果的关联。此外，案情事实中通常包含多个行为动作，其中某些行为对判决结果产生的影响不大。如何找到句子的中心行为要素并建立关联关系对于案情过程表示有重要影响。

因此，本文将犯罪过程表示为一系列以“行为”为核心且具有时序关系的案件要素，即案件要素序列，并融合文本语义表示，实现结合案件要素序列的罪名预测。本文主要贡献如下。

● 本文提出了一种结合案件要素序列的罪名预测方法。该方法利用图卷积神经网络（graph convolutional network， GCN）模型获取案件要素序列表示，利用卷积神经网络（convolutional neural network，CNN）模型获取文本语义表示，然后融合进行罪名预测。

● 在实验部分，通过与现有方法进行对比，融合案件要素序列表示能显著提高罪名预测性能，本文方法的有效性得到验证。特别地，该方法对易混淆罪名区分也有良好的表现。

2 相关工作

作为法律审判预测的重要任务之一，罪名预测指根据给定的案件预测罪名。在早期罪名预测任务中，大部分工作使用统计分析方法。后来量化分析和关联分析被提出，但这类方法局限性较强，只针对特定领域的数据集。

随着机器学习的发展，罪名预测任务可以分为基于特征工程和基于神经网络的方法。Lin W C等人重点讨论了强盗罪和恐吓取财罪，并定义了21种法律要素标签，利用这些要素标签进行罪名分类。Liu Y H等人提出一种基于文本挖掘的方法，使用支持向量机（support vector machine，SVM）进行分类。在人工智能技术的加持下，法律研究逐渐变得智能化、自动化。Jiang X等人通过深度强化学习方法提取事实部分的依据并将该依据信息融入分类模型，从而提高准确性。Kang L Y等人针对刑事案件的事实部分，根据罪名的定义来创建辅助事实以扩充其表示，从而提高预测准确率。Yang X T等人从事实描述中提取出相关片段进行特征增强，将罪名作为监督标签进行预测。刘宗林等人从事实描述中抽取有助于区分易混淆罪名的指示性罪名关键词，从而解决罪名预测任务中的罪名易混淆问题。除了使用案情事实部分，相关研究者还引入案件相关信息来辅助预测。Luo B F等人提出基于注意力的神经网络方法，并引入法条信息进行罪名预测。Hu Z K等人针对低频罪名和易混淆罪名引入10个有代表性的属性进行区分，利用注意力机制生成与属性相关的事实表示，依据不同属性进行预测。He C Q等人提出一种序列增强的胶囊网络模型来解决低频罪名，并设计一个注意力残差单元来提供辅助信息。敖绍林等人利用三元组损失（triplet loss）技术调节CNN，从而更好地学习案件表示的语义特征向量。当前研究大多采用增强案情事实信息或引入辅助信息的方式。通过分析真实案例发现案件要素和行为发生顺序对于审判结果有显著影响，但上述研究没有考虑该情况。在司法要素方面，黄辉等人提出了基于BERT阅读理解框架的司法要素抽取方法，该方法建立了辅助问句和裁判文书之间的语义联系，增强了模型的学习能力。张虎等人通过抽取判决要素，结合法条与语义差异性进行罪名预测。

近年来，图神经网络（graph neural network