【案例】--非结构化数据中台案例

本文探讨了非结构化数据中台的设计思路,重点在于如何利用mongodb存储非结构化数据并实现增删改查。针对查询难题,提出了结合低代码理念和HanLP技术的解决方案,通过字段模型和自定义词典实现灵活的条件查询,以适应不同业务线的需求。同时,介绍了字段代号的概念,允许后续的灵活配置。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、前言

最近接触一个平台架构的讨论,公司需要一个非结构化数据中台,理念是能够满足存储随时变换的非结构化数据,另外引入低代码思想。由于非结构化数据是未知的,不同业务的数据是不同,为了更好的使用,低代码就需要一种方案,在尽量不开发代码下满足相关需求变化,快速迭代上线。

1、思考

由于项目场景接触的都是非结构化数据,为了更好/更智能的管理,非结构化数据中台应该如何设计?
首先,非结构化数据信息的存储可以利用mongodb。
最基本的文件业务要满足增删改查。
“增”:一个文件add,首先怎么的数据结构去映射得到相应的字段信息,非结构化数据的特点是不确定性,不同文件需要解析映射的字段是变化的,很难一套具体的字段满足条件。
“查”:搜索引擎方式查询是最常见的,由于非结构化数据字段不确定性,搜索的查询方式条件去定位具体字段查询,往往代码实现难度大。基于低代码理念和非结构化数据,要有更灵活的方案来优化提升“查”功能。
文件如何便捷化管理。
所谓的便捷化管理,能够更快更多的知道一个文件(如pdf、office等)的相关信息,且方便一些业务操作等等。【“(非结构化)文件管理案例”可以提供思路】</

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

DreamBoy_W.W.Y

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值