![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
DataFunTalk原创精选
文章平均质量分 91
DataFunTalk
这个作者很懒,什么都没留下…
展开
-
OLAP技术的选择,进化和思考
“在多年以前,数据库的硬件瓶颈主要在于磁盘和网络带宽,随着磁盘读写速度和网络带宽的提升,也就是IO不会成为数据库的明显瓶颈。”炎凰数据研发工程师吴立表示,“如今,CPU成为了数据库执行效率上的新的瓶颈。”原创 2023-12-21 13:47:33 · 951 阅读 · 0 评论 -
降本不增“笑”的正确打开方式
在应用分发场景深挖用户价值,怎么做到的?原创 2023-12-21 12:02:57 · 954 阅读 · 0 评论 -
B站基于缓存优化 PRESTO 集群查询性能
当 Presto 去 Hive Metastore 查询的时候,如果想要访问 Alluxio 的数据时,比较简单的做法是将 Hive Metastore 里相应的 scheme 转换为 Alluxio 的 scheme,但这会带来的问题是对于其他的引擎(比如 spark),因为其本来就没有接入 Alluxio,会导致查询不可用。Dispatcher 是一套内部自研的服务,根据查询 HDFS 的数据量、目前引擎的负载情况等将用户提交的 query 路由到相应的引擎进行执行。此问题已经在社区中有了相应的修复。原创 2023-02-13 18:39:20 · 892 阅读 · 1 评论 -
可扩展的图神经结构搜索系统
张文涛 博士|腾讯 Angel Graph团队成员原创 2023-02-08 16:15:00 · 255 阅读 · 0 评论 -
图算法在风控场景的应用
在现实应用中,很多时候我们没有办法对黑白灰样本去做完全精确的定位。那该如何利用类似社交网络的同质性(好人和好人关系近,坏人和坏人关系近)做团伙识别?在风控场景,很容易通过强规则产出高准确率的样本,但覆盖率很低(低召回),那么如何扩充这些样本呢?原创 2022-12-16 17:04:01 · 1670 阅读 · 0 评论 -
基于知识图谱的多模内容创作技术
机器真的可以像人类一样去创作吗?机器创作的方式是怎样的?机器创作有哪些价值?原创 2022-12-14 12:00:57 · 569 阅读 · 0 评论 -
京东零售大数据云原生平台化实践
云原生这个概念大家已经很熟悉了,但是否有一个准确的定义呢?每个人都在说云原生,但大家对云原生的理解是不同的。原创 2022-12-03 15:13:09 · 674 阅读 · 0 评论 -
火山引擎虚拟数字人技术与应用
火山引擎正在打造完善的虚拟数字人技术和应用体系,那么火山引擎是如何定义虚拟数字人的呢?火山引擎 2D 虚拟数字人和 3D 数字人采用了怎样先进的技术?火山引擎数字人有哪些应用和前景展望?今天我们就来一起探秘火山引擎虚拟数字人技术与应用。原创 2022-12-03 20:00:00 · 3166 阅读 · 2 评论 -
陈宏申:浅谈京东电商商品文案挖掘难点与优化实践
导读: 在电商推荐中,除了推送商品的图片和价格信息外,文案也是商品非常重要的维度。基于编码器解码器范式的序列文本生成模型是文案挖掘的核心,但该种方法面临着两大技术挑战:一是文案生成结果不可靠和生成质量不可控,无法满足业务对电商商品文案内容可靠性的严格要求;二是序列文本生成模型经常面临数据坍塌,比较容易生成万金油式的安全文案,文案内容本身的多样性会越来越低,且无法捕捉语言本身的流行或演化趋势。针对以上两大挑战,在以文案生成系统为核心的基础上,引入了文案摘要清洗系统和文案质量评估系统,总结提出了一个通用的电..原创 2022-05-25 19:58:15 · 439 阅读 · 0 评论 -
徐童:视频人物社交关系图生成与应用
导读: 在线社交媒体平台的发展,带来了细粒度检索、视频语义摘要等媒体智能服务的巨大需求。现有的视频理解技术缺乏深入的语义线索,结合视频中人物的社交关系才能更完整、准确地理解剧情,从而提升用户体验,支撑智能应用。这里主要介绍我们将动态分析和图机器学习相结合,围绕视频中的人物社交关系网络所开展的两个最新的工作。主要内容包括:问题背景关系图生成关系图应用未来展望--01 问题背景** 1. 现有视频理解技术缺乏深入语义线索**现有的视频理解技术更多地着眼于描述画面里人物的行为、动作、身份..原创 2022-05-21 14:38:14 · 126 阅读 · 0 评论 -
音频内容理解的关键技术
为什么要使用机器来理解音频内容呢?一个重要的出发点就是在大量数据存在的情况下,由人来完成音频内容的理解是一件较为困难的事情,在图片和文本处理方面,快速理解尚有一定实现的可能,古代有一个形容人记忆力很好的成语叫做走马观碑,描述一个人骑着快马路过一个石碑,看到石碑上密密麻麻的小字一瞬间就能够全部记下来。但是对于音频与视频这种内容,即使在加速的情况下也需要一定的时间来听完、看完音频和视频内容才能够进一步理解它。如果采取人力处理这些问题会遇到困难,我们就可以借助于机器辅助人来进行处理。机器在理解音频的过..原创 2022-04-20 18:15:00 · 2657 阅读 · 0 评论 -
Pony.ai 的基础架构挑战与实践
导读:本次分享将从以下几个方面介绍——Pony.ai 基础架构做什么 车载系统 仿真平台 数据基础架构 其他基础架构--01 Pony.ai 基础架构首先给大家介绍一下 Pony.ai 的基础架构团队做什么。互联网公司在系统基础架构在业务扩展时通常会遇到一些通用的技术挑战,比如存储系统、计算平台还有 Web 服务治理。对于 Pony.ai 而言我们是一家做自动驾驶的公司,除了上述提到的互联网公司会遇到的一些技术挑战之外,会有很多自动驾驶技术本身相关的技术挑战,比如大家都可以...原创 2022-04-19 16:58:59 · 376 阅读 · 0 评论 -
张陈丞:第四范式智能风控中台架构设计及应用
风控是金融最常见的场景之一,本文将从业务和技术架构两个层面探讨如何落地智能风控中台系统。原创 2022-04-19 15:28:08 · 1034 阅读 · 0 评论 -
北大邹磊:图数据库中的子图匹配算法
本文从图数据库中的核心查询算子——子图匹配入题,介绍了图数据库的基本概念、子图匹配的算法,以及在图数据库环境下的子图匹配查询优化等内容。原创 2022-04-18 15:25:53 · 5776 阅读 · 0 评论