大数据、数据架构、推荐冷启动...小红书的 AI 数据新方案都在这个会

伴随着行业数据持续积累,人工智能正加速渗透各类场景,大数据、数据架构和推荐系统等领域,依然是各行各业目之所聚。4 月 19  至 20 日,「DataFunCon 2024 · 上海站」来袭!大会以“数聚垂域,智领未来”为主题,将在上海龙之梦大酒店举行。

小红书技术副总裁风笛出任大会专家团,携手上海市数据科学重点实验室,以及阿里巴巴、百度、京东等多家行业领军代表,共同策划 60 余场精彩议题,深入探讨“ 大数据 + AI ”在各个行业中的落地应用。

小红书存储和数据库团队负责人刘备(毛琦),担任「数智 · 大数据系统论坛」工业出品人,与来自抖音、清华大学、复旦大学、哈尔滨工业大学等多位数据智能技术专家,畅聊大数据系统探索的最新实践。

  • 实时湖仓如何保证数据质量的同时,实现低延迟数据处理?

  • 在缺乏用户历史数据情况下,推荐系统如何有效地为新内容找到目标受众?

  • 如何提升图数据库的多跳查询性能,满足在线业务的实时性要求?

这类问题不仅推动着技术创新探索,也激发了我们对技术落地的无限想象力。

4 月 19 日起,小红书技术团队将接连贡献三个精彩议题,解答上述问题。小红书数据引擎湖仓架构团队负责人庞博、社区推荐算法专家巴斯、分布式数据库架构师再兴将在峰会现场带来实时湖仓架构在小红书的探索与实践、《高时效推荐实践 - 从系统提效到内容冷启动》和《小红书图数据库在分布式并行查询上的探索》的主题分享。

分享日程

4 月 19 日 17:20-18:05「新一代数据架构论坛」

庞博(孙超) |   小红书数据引擎湖仓架构负责人

在数据驱动时代,实时湖仓架构正成为企业快速响应市场变化、提升决策效率的关键。庞博拥有丰富的数据平台架构设计与优化经验,在本次分享他将带领我们深入探讨:小红书如何结合线上业务场景和需求,通过 OLAP 和数据湖技术的深度融合,实现架构的优化升级。

庞博将详细阐述小红书湖仓架构的演进历程,并围绕“产出更快”“查询更快”这两个核心需求,分享小红书实时湖仓架构的创新策略和成果。通过一系列实际案例分析,他将展示如何运用近实时入湖、StarRocks、Iceberg 等前沿技术,有效降低数据处理成本,提升查询性能和效率。

4 月 19 日 17:20-18:05「推荐系统论坛」

巴斯(陈祈烨) |   小红书社区推荐算法专家

小红书如何打造一个分钟级的高时效推荐系统,快速满足用户的个性化需求?内容冷启动作为推荐系统的核心环节,对于新内容的传播和用户参与度的提升至关重要。本次分享,巴斯将深入剖析高时效推荐系统的构建过程和内容冷启动的关键策略。

巴斯在视频推荐、内容冷启动及社交推荐等领域拥有多年实战经验。他将分享小红书去中心化高时效分发系统的实践和挑战,从推荐时效性提升开始,延伸至内容冷启动的多项探索和技术实践。通过实际案例分析,巴斯将揭示如何利用创新算法和策略,解决新内容在缺乏历史数据和用户反馈情况下的推荐难题。

4 月 20 日 16:35-17:20 「数智 · 大数据系统论坛」

再兴(李凝瑞) |   小红书分布式数据库架构师 

图数据库作为数据库领域的重要分支,虽然经过数十年发展并涌现出众多产品,但在互联网公司的在线业务应用中,其查询能力的使用却往往局限于两跳以内。这主要是因为传统数据库在三跳及以上的查询时延过长,无法满足在线业务对实时性的高要求。

小红书数据库团队通过分析原查询模式上的弊端,并提出优化点,将分布式并行查询的思想应用于图数据库,显著提升多跳查询的响应时间。再兴,作为 Apache 社区开源项目 HugeGraph 的核心创始人、小红书图数据库产品 REDgraph 核心成员,将在本次分享中详细介绍这一技术探索。

在本次分享中,再兴将从图数据的基本概念讲起,深入探讨多跳查询在业务中的应用和面临的性能挑战。他将阐述团队如何识别并优化原查询模式,以及为什么选择分布式并行查询作为突破口。通过介绍基于 MPP 理念的技术实践,包括架构改造、查询计划改写、起点 ID 去重等优化措施,再兴将揭示这些创新如何实现查询性能的显著提升。

图片

限时赠票

想想要亲临上海峰会现场,一览数据智能的探索实践?

我们将免费送出门票一张

转发推送至朋友圈,微信后台回复「DataFun」,即可参与抽奖。

我们将抽取 1 位幸运的小伙伴

获得 DataFunCon 2024·上海站门票(不含餐)。
 

抽奖截止时间:4 月 18 日  12:00


温馨提示:

中奖者请在 6 个小时内留意消息,添加小助手微信【微信号:REDtech01】,凭中奖信息和转发截图领取电子门票。

  • 11
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
推荐系统的冷启动,是指在推荐系统运行初期或者添加了一类物品时,由于缺乏足够的用户行为数据,导致难以对这些物品进行个性化推荐的问题。通常情况下,推荐系统的推荐准确度与数据量成正比,缺乏行为数据的物品很难被推荐系统准确地推荐给用户,这就是冷启动问题。 解决推荐系统的冷启动问题的方法有很多,下面列举一些: 1. 利用物品属性信息:对于物品,可以利用物品的属性信息来进行推荐,比如对于电影,可以根据电影的类型、导演、演员等属性信息,结合用户的偏好,进行推荐。 2. 利用用户画像信息:通过收集用户的个人信息、兴趣爱好、历史行为等数据,建立用户画像,从而对物品进行个性化推荐。 3. 利用专家知识:对于某些领域的专家,可以通过其对物品的评价或分类,来对物品进行推荐。 4. 利用协同过滤算法:通过对用户和物品相似度的计算,来进行推荐,比如基于物品的协同过滤算法或基于用户的协同过滤算法。 5. 利用探索-利用策略:在推荐系统中加入一些随机性,对物品进行探索,同时也保持对已有数据的利用,从而达到平衡推荐精度和推荐多样性的目的。 需要注意的是,不同的推荐系统冷启动问题可能存在不同的解决方法,需要根据不同的场景和数据类型选择适合的解决方法。同时,通过不断的数据收集和分析,也可以逐步解决推荐系统的冷启动问题。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小红书技术REDtech

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值