Datafun Talk2021 知识图谱交流会回顾

1. 知识图谱与图数据库

存成关系型数据可的问题:

知识图谱存储

2. 企业知识图谱构建技术与挑战

少样本关系抽取

增量关系抽取

主动学习

3. 从零样本做中文知识标注与挖掘(百度)

百科知识树(通用知识)

文本标注挖掘(应用百科知识树)

4. 图谱问答在小爱场景的应用

4.1 整体架构

4.2 信息抽取

  1. 关系抽取

吴京主演战狼,吴京也导演了战狼

基于指针网络的关系抽取模型:

PSO模型(先抽取P,再抽取s和o)

两种模型召回,然后接入到判别模型里面进行判断

2. 事件抽取

4.3 图谱问答

· 文法解析

· 槽位提取

· 图谱问答

5. 美团大脑: 美食领域知识图谱构建及应用进展

5.1 标签图谱

数据来源:美团点评的评论内容(非结构化自然语言数据,但是有海量的信息存储其中)

1. 标签挖掘: 更多的类似于属性级的观点抽取,跳字标签,就是属性和观点词中间有上下文。 这里把属性词和修饰词(观点词)都当成ner来抽取。

2. 标签关系

标签同义词挖掘

无监督场景下,加入对比学习。 让相似的样本距离更靠近,不同的样本距离更远。在实验效果上,可以去的类似于sentence bert的效果

标签上下位挖掘

类似于标签同义词挖掘

3. 图谱打标

商户打标(商户和用户打标签关联)

POI兴趣点,一般指地理位置

判别模型:

4. 应用

4.1 知识问答

4.2 补充召回

5. 知识图谱表示学习

把tag和poi都作为节点,表示成向量,边就是二者的相似度。表示出来以后,可以直接计算tag和poi之间的相似度

6. 图谱应用于推荐

5.2 菜品知识图谱构建

  1. schema层

2. 菜名理解

3. 深度学习模型泛化inference

知识挖掘&显式推理

4. 多模态+结构化 预训练&推理

帮助更好的识别菜品信息

query1: 商户标签怎么定的

人工筛选,人工check

query2:同义词负样本怎么构建?

一开始有一些初始overlap数据,进行标注.

后面用模型预测置信度在0.5附近的样本,送给人工标注

query3:标签图谱存储工具

开源的图数据库

query4: 打标工具:

自己搭建

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
2020 DataFunTalk 年终大会汇聚了国内一线互联网大厂的专家探讨目前最火热的技术交流与分享。 1.用户增长 网易严选-数据技术驱动全渠道用户触达 有赞-有赞数据驱动增长体系的建设 智能小程序-基于doris构建的小程序私域流量增长 2.知识图谱 百度-百度知识图谱技术及应用 贝壳-基于事理图谱的智能培训 美团-美团大脑系列商品知识图谱的构建及应用 3.推荐算法 58同城-多业务融合推荐场景下的深度学习实践 阿里-深度排序模型在淘宝直播的演进和应用 阿里妈妈-深度树匹配召回体系演进 阿里妈妈-算力效能技术体系之阿里定向广告 阿里算法-粗排技术体系与最新进展 阿里淘系-边缘计算在推荐系统中的应用 快手-多目标排序在快手短视频推荐中的实践 陌陌-模型化召回在陌陌社交推荐的探索和应用 4.风控安全 人寿-模型可解释性在保险理赔反欺诈中的应用实践 5.大数据架构 车好多-结构化大数据链路在车好多的实践 滴滴-基于Logi-KafkaManager打造专业易用KafkaPAAS服务 腾讯-如何让Ozone成为HDFS的下一代分布式存储系统 T3出行-基于Apache Hudi构建数据湖上低延迟CDC的实践 Tubi-Tubi的数据质量体系结构 6.自然语言处理 阿里-阿里多语言翻译模型的前沿探索以及技术实践 华为-细粒度文本情感分析及其应用 小米-小米对机器翻译的探索和实践 字节-Volctrans:Applicationand Research LightSeq-高性能NLP序列推理实践 7.数据仓库 阿里云数据库ClickHouse技术分享暨海量数据分析场景应用实践 贝壳基于Apache Druid 的OLAP 引擎应用实践 滴滴指标体系建设实践分享 陌陌大数据治理与优化实践 熵简-金融资管数据中台体系的探索和实践 8.数据产品 网易严选-全链路市场投放的数据产品 转变,贝壳找房数据平台演进 AI手机产品化实践与思考 9.大数据应用 爱奇艺数据中台服务化建设 基于大数据技术构建爱奇艺全链路监控平台 bilibili-数据湖的初步探索与实践落地 Doris 在小米数据中台中的应用 Impala 3.4在网易的优化实践 10.广告算法 阿⾥妈妈定向⼴告智能投放体系和技术 短视频场景下信息流广告的挑战和技术 因果推断在飞猪广告预算分配中的应用 11.计算机视觉 地平线-边缘计算时代下的计算机视觉技术落地实践 多媒体内容理解在美图社区的应⽤实践 视频基础技术在百度的应用 图匠-一种面向自然场景下的低质文本识别方法 微软-计算机视觉中的自监督学习与 Transformer 注意力建模 12.搜索算法 百度-5G+智能时代的多模搜索技术 飞猪-旅行场景下搜索技术应用与创新 搜狗搜索精准问答技术研究与应用 13.机器学习平台 58同城-深度学习平台在提高模型推理性能和 GPU 使用率上实践 旷视-Data Provider Solution for DLT on Brain++ 小米-vGPU在机器学习平台的多场景应用 14.对话智能 清华-Do Pretraining Language Models Really Understand Language? 清华-Knowledgeable Pretrained Language Models 15.数据治理 美团酒旅数据治理实践 网易严选数据任务治理实践 有赞数据治理之提质降本
知识图谱推理在医学领域有着广泛的应用。医学知识图谱推理可以帮助医生收集健康数据、诊断疾病和控制错误。例如,一些研究提出了基于规则推理和案例推理的混合方法来构建临床决策支持系统,帮助重症监护病房(ICU)的医生做出决策。还有一些研究设计了基于逻辑推理和概率细化的本体驱动的鉴别诊断系统,以及基于本体的智能监护治疗系统,通过推理过程向医生提供治疗建议。此外,还有研究将中医药知识图谱中存储的数据转换为推理规则,根据患者数据推断出辅助处方。医学知识图谱推理的目标是处理大量重复的矛盾信息,提高医学诊断的自动化水平,减少诊断时间。然而,传统的知识推理方法存在学习能力不足、数据利用率低等问题。因此,需要进一步研究和探索高效的医学推理模型来应对医学领域中不断增长的数据和信息缺失的挑战。\[2\] 在知识图谱推理的研究中,有几种常见的推理方法。基于规则的推理是其中之一,它使用一阶谓词逻辑规则来进行推理。另一种是基于表示学习的推理,它使用张量分解、距离模型、语义匹配模型等方法来进行推理。还有基于多源信息和基于神经网络和强化学习的推理方法。这些推理方法可以帮助我们从知识图谱中推断出新的知识和关系。\[3\] 总而言之,知识图谱推理在医学领域有着广泛的应用,可以帮助医生做出诊断和治疗决策。通过推理方法,我们可以从医学知识图谱中获取更多的信息,并提高医学诊断的准确性和效率。\[2\] #### 引用[.reference_title] - *1* [基于逻辑规则的图谱推理](https://blog.csdn.net/DataFun_Hoh/article/details/124544287)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v4^insert_chatgpt"}} ] [.reference_item] - *2* *3* [基于知识图谱的知识推理](https://blog.csdn.net/minggelin1997/article/details/109024359)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v4^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值