【知识图谱项目】0 知识图谱整体架构分析

本文介绍了知识图谱的构建流程,涉及数据库工程师、NLP工程师、爬虫工程师和知识图谱工程师的角色分工。数据库工程师负责模板表和相似度模型,NLP工程师处理非结构化数据,爬虫工程师补充数据,知识融合阶段训练词向量模型。知识图谱工程师则根据业务场景定制算法。对于团队协作和业务理解不清晰的问题,提出了需要深入理解业务和技术选择,以及明确需求的重要性。
摘要由CSDN通过智能技术生成

0 知识图谱项目框架设计

在这里插入图片描述

1 流程解析

  1. 数据库工程师的职责:目前已有的数据主要是一堆业务领域上的表格数据,存储在一系列关系型数据库上面,需要做一个模板表和相似度比对模型,填充模板表后才能进行知识图谱构建;
  2. NLP工程师的职责:之后分配非结构化数据让NLP工程师对文本数据进行解析,要求提取出的信息可以填充到模板表上;
  3. 爬虫工程师/数据处理工程师:有些字段的数据不足,爬虫工程师需要负责爬取有一些半结构化数据进行数据补充;
  4. 知识融合阶段主要是根据语义进行融合,需要训练一个业务领域内的封闭式词向量模型,这里属于NLP工程师的职责;
  5. 知识图谱工程师:知识计算阶段,这些算法要根据具体的业务场景进行定制,进而利用这些算法来实现这些业务场景下的功能,此处需要注意明确需求;
  6. 知识图谱工程师+NLP工程师:知识应用属于一些下游任务,它们的设计更多的是一整套系统,有时候也会是一些功能点,这一块依然需要结合具体的业务进行配置。

2 进一步思考

  1. 如果之前没有接触过该方面的业务,甚至不知道是使用哪些技术契合该业务系统,该怎么办?
  2. 如何在一个小团队中,合理分配任务,彼此进行配合和交接?
  3. 产品经理对该业务功能点的描述太宽泛,或者不具体,该怎么办?

在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值