交易流水应用
文章平均质量分 95
数智笔记
目前从事数据挖掘工作,期望在自己学习总结的同时,也能分享有益的东西给别人,希望有志者能在数据挖掘领域共同进步
展开
-
交易流水分类 基于cograph编辑的网络聚类在发票分类中的应用 User-generated short-text classification using cograph editing-bas
在线业务平台的快速发展在各个领域创造了大量与产品或服务描述、评论、营销、开发发票和记账相关的用户生成文本数据。这些数据通常长度较短,含有噪声(例如拼写错误、缩写),并且没有准确的分类标签(行项目类别)。对这些用户生成的短文本数据进行适当的行项目分类对于相应平台理解用户需求至关重要。本文提出了一个基于确定的行项目类别进行用户生成短文本分类的框架。在行项目识别阶段,我们使用了基于关键词网络的cograph编辑(COE)聚类,该网络可以从用户生成的短文本中构建。我们还提出了整数线性规划(ILP)对于加权网络上的C原创 2024-04-08 16:19:09 · 865 阅读 · 2 评论 -
交易流水分类 大规模个性化财务交易分类 Large-Scale Personalized Categorization of Financial Transactions
财务会计的一个重要部分涉及使用会计师称之为“账户表”的可定制文件系统来组织业务交易。这项任务必须针对每笔财务交易进行,因此自动化对会计软件用户具有重要价值。在本文中,我们介绍了一个大规模推荐系统,该系统被美国、英国、澳大利亚、加拿大、印度和法国数百万小型企业使用,每年用于组织数十亿笔财务交易。该系统利用机器学习,以一种能够准确推荐账户表类别的方式,即使用户已经创建了自己的类别或使用缩写或外语命名它们。即使给定用户以前从未对类似交易进行分类,也能处理交易。原创 2024-04-08 16:17:40 · 704 阅读 · 0 评论 -
交易流水分类 可扩展的弱监督银行交易分类 SCALABLE AND WEAKLY SUPERVISED BANK TRANSACTION CLASSIFICATION
本文旨在利用弱监督、自然语言处理和深度神经网络技术对银行交易进行分类。我们的方法通过利用启发式和领域知识来训练准确的交易分类器,最大程度地减少对昂贵且难以获取的手动注释的依赖。我们提出了一种有效且可扩展的端到端数据处理流程,包括数据预处理、交易文本嵌入、锚定、标签生成、区分性神经网络训练,并概述了系统架构。我们通过展示我们的方法的有效性,证明其优于现有市场领先解决方案,实现了准确分类,并且可以快速扩展到新颖和复合用例。这反过来可以解锁许多金融应用,如财务健康报告和信用风险评估。关键词弱监督⋅\cdot⋅。原创 2024-04-08 16:13:52 · 696 阅读 · 0 评论 -
交易流水分类 对图中的长尾类别进行表征 Characterizing Long-Tail Categories on Graphs
长尾数据分布在许多现实世界网络中普遍存在,包括金融交易网络、电子商务网络和协作网络。尽管最近的发展取得了成功,但现有的研究主要集中在通过图增强或目标重加权来消除机器学习模型的偏见。然而,目前文献中缺乏提供理论工具来表征图中长尾类别行为并了解实际场景中的泛化性能。为了弥补这一空白,我们提出了第一个用于图中长尾分类的泛化界限,通过将问题形式化为多任务学习的方式,即每个任务对应于一个特定类别的预测。我们的理论结果表明,长尾分类的泛化性能主要受到所有任务的损失范围和任务总数的影响。基于理论发现,我们提出了一个新颖的原创 2024-04-08 16:12:36 · 1149 阅读 · 0 评论