- 博客(70)
- 收藏
- 关注
原创 和小红书一起参会! 了解大模型与大数据融合的技术趋势
7 月 5 至 6 日,「DataFunCon2024·北京站」将在北京丽亭华苑酒店火热开展!
2024-07-02 15:00:33 829
原创 小红书 2024 大模型论文分享会来啦,与多位顶会作者在线畅聊!
ICLR、ACL、CVPR、AAAI、SIGIR、WWW 等国际顶会论文作者在线和你交流
2024-06-21 16:26:57 934
原创 WebGPU 引领前端未来,互动渲染如何驱动小红书业务增长?
第十期技术沙龙精彩回顾来啦~海内外专家齐聚小红书,速看 5000+人直播围观的 Web 技术干货!
2024-06-05 17:34:03 805
原创 小红书云原生 Kafka 技术剖析:分层存储与弹性伸缩
一文解析小红书 Kafka 如何基于云原生存储和负载均衡等技术,实现 60% 的存储成本节省和 10 倍的扩缩容运维效率提升, 并成功打造「弹性伸缩、按量付费」的商品化模式
2024-05-25 16:27:32 1170
原创 W3C 标准带头人开讲 WebGPU 前沿趋势,小红书线下沙龙开放报名!
大咖来袭!5月24日 19:00-21:30 François Daoust 与你会面
2024-05-17 19:48:05 1046
原创 CVPR 2024|多模态场景感知,高保真运动预测框架来了!
小红书创作发布团队提出场景感知运动预测技术(SIF3D),荣获计算机视觉领域顶级会议 CVPR 2024 收录。
2024-05-11 14:42:58 1310
原创 小红书从记忆机制解读信息检索,提出新范式获得 EACL Oral
小红书搜索团队提出生成式密集检索范式,实现了记忆机制与向量匹配机制的优势互补,该项工作已被 EACL 2024 接收为 Oral。
2024-04-29 17:36:33 840
原创 大数据、数据架构、推荐冷启动...小红书的 AI 数据新方案都在这个会
4 月 19 日 - 20 日,探索人工智能与数据最新行业实践,抽奖赢「DataFunCon 2024 · 上海站」门票!
2024-04-16 18:41:51 1178 1
原创 小红书搜索团队提出新解码策略,降低大模型推理成本
该研究通过引入早停止策略,显著降低大模型自洽性方法的推理成本,并提供可控模式以供动态选择,此创新成果已被人工智能顶会 ICLR 2024 接收。
2024-04-16 18:16:33 987
原创 小红书离线数仓提效新思路,提升百倍回刷性能
为了突破现有以 Spark 为核心的数仓架构在资源和时间消耗上的限制,小红书数据仓库团队将 StarRocks 融入到离线处理流程,替换掉部分 Spark 处理的任务,并优化较为耗时的 Cube 计算,大幅度提高了数据的执行效率。小红书数据仓库团队经过一系列创新实践,通过改造离线处理链路,有效降低了任务资源消耗,提前数据产出时间,将回刷时间减少 90%,回刷成本减少 99% 以上。阅读本文,小红书技术团队和你分享离线数仓提效新思路!
2024-03-19 11:51:07 1279
原创 释放数据湖潜力:小红书如何实现数仓效率与成本的双重优化
实时技术与数据湖技术的结合,成为催动数仓架构迭代的新引擎,提升数仓产出时效&查询性能,助力数据协助业务决策走上新台阶
2024-03-04 17:49:15 1619
原创 GitHub 斩获 8300 星,小红书爆火开源 InstantID 要开直播了!
2 月 29 日 20:00-21:00,InstantID 幕后团队揭晓技术细节!
2024-02-27 19:19:53 1357
原创 小红书论文刷新 SOTA:人体动作预测再升级,能精准到指尖
在AAAI 2024 上,小红书提出 EAI 框架,开创性地实现了对人体躯干关节及细粒度手势的未来动作协同预测。
2024-01-31 19:17:02 1515
原创 小红书可观测 Metrics 架构演进,如何实现数十倍性能提升?
在当前云原生时代,随着微服务架构的广泛应用,云原生可观测性概念被广泛讨论。可观测技术建设,将有助于跟踪、了解和诊断生产环境问题,辅助开发和运维人员快速发现、定位和解决问题,支撑风险追溯、经验沉淀、故障预警,提升系统可靠性。可观测技术主要包括 Metrics、Logging、Tracing、Profiling 等,其中 Metrics 是最重要的基石,它不仅为业务监控和系统监控提供基础数据,还是构建告警系统、性能优化和容量规划的核心,这些都对 Metrics 体系的稳定、实时、高效提出了更高的要求。
2023-12-15 15:54:25 654
原创 小红书基于零信任 SASE 办公安全解决方案,斩获 “IDC 中国 20 大杰出安全项目”
在以往依赖网关实现的风控方案中,网关无法拿到终端的安全信息。在数据安全建设实践中,摒弃了传统边界安全的假设,基于零信任的原则,创新构建一套灵活办公的链路,将访问控制、实时风控、数据不落地、行为分析能力服务化。管控力度更精细、权限可自动梳理、运维难度更低,对终端、身份、行为和数据等进行全生命周期的精细化准入管控,确保终端符合内外部的相关准入要求,做到合法合规,准入可信。然而,若团队直接使用 SASE,既无法利用小红书自有业务网关优势,也要放弃小红书在网关上积累的风控能力,与企业内部的数据管理脱节。
2023-12-13 18:02:10 278
原创 FFA 2023 明日开幕,Flink 智能诊断、小红书流批一体实践精彩来袭
12 月 8-9 日 Flink Forward Asia 2023 ,小红书 Flink 实践分享!
2023-12-07 20:24:23 136
原创 CNCC 2023 | 大模型全面革新推荐系统!产学界多位大咖精彩献言
近日,第二十届中国计算机大会 (CNCC 2023) 在沈阳召开。为进一步促进学术界和产业界的交流,10 月 27日 13:30-17:30,小红书在大会现场举办「大模型与推荐系统」技术论坛。本论坛由小红书技术副总裁风笛、中国科学技术大学教授何向南担任主席,邀请清华大学计算机科学与技术系教授张敏、中国人民大学高瓴人工智能学院教授赵鑫、华为诺亚方舟推荐与搜索实验室主任唐睿明等知名专家学者,共同深入挖掘和探讨“大模型与推荐系统”在技术、应用和研究方面的最新进展。
2023-11-20 11:02:04 605
原创 ICCV 2023|小红书 4 篇入选论文亮点解读,「开集视频目标分割」获得 Oral
近日,ICCV 正式揭晓 2023 年论文接收结果,小红书技术团队共有4篇论文入选,其中1篇为 Oral 论文(Oral 接收率仅为 1.88%),最新科研成果涵盖了视频目标分割、3D 数字人重建、人体运动预测、视频分析等领域。
2023-11-20 10:41:41 328
原创 ClickHouse 存算分离改造:小红书自研云原生数据仓库实践
REDck 通过云原生架构升级,能够处理万亿级数据规模,实现秒级 OLAP 查询,支持分钟级自动故障恢复、弹性扩缩容能力,成本优化效果显著。
2023-09-07 14:22:21 1072 1
原创 推荐系统在线峰会来了,冷启动、推荐工程、模型训练…你都能找到答案
8 月 26 至 27 日 09:00-12:35,「推荐系统在线峰会」全程线上直播,与你不见不散
2023-08-25 14:06:08 442
原创 画质提升+带宽优化,小红书音视频团队端云结合超分落地实践
随着视频业务和短视频播放规模不断增长,小红书一直致力于研究:如何在保证提升用户体验质量的同时降低视频带宽成本?
2023-08-18 15:37:38 1946
原创 CVPR2023|小红书提出 OvarNet 模型:开集预测的新SOTA,“万物识别”有了新玩法
在 CVPR2023 上,小红书社区技术团队提出了一项全新任务 —— Open-vocabulary Object Attribute Recognition(面向开放词汇的目标检测与属性识别)
2023-06-27 13:33:41 471
原创 让算力不再成为瓶颈,小红书机器学习异构硬件推理优化之道
在全球降本增效的趋势下,异构计算成为了一种很有前途的方向,可以通过将不同类型的处理器(如 CPU、GPU、FPGA 等)组合在一起来提高计算性能,从而实现更好的效率和更低的成本。
2023-05-18 17:05:58 415
原创 小红书如何应对万亿级社交网络关系挑战?图存储系统 REDtao 来了!
由于读请求会随机读取本区的任何一个 MySQL 数据库,因此 DTS 订阅使用了一个延迟订阅的功能,保证从 binlog 同步最慢的节点中读取日志,避免 DTS 的 invalidate cache 请求和本区 read cache miss 的请求发生冲突从而导致数据不一致。对比 2022 年初和 2023 年初,随着 DAU 的增长,社交图谱的请求增长了 250% 以上,如果是之前 MySQL 的老架构,扩容资源基本上和请求增长速度成正比,至少需要扩容 1 倍的资源成本(数万核)。但凡变革,皆属不易。
2023-05-04 13:45:04 644
原创 当推荐和搜索遇上大模型,会碰撞出什么样的火花
小红书人的工作方式是“走进用户”,重视用户体验的态度也融入到了小红书App中,例如坚持使用双列的产品形态,是为了给用户自由选择的权利。此外,为让有共同兴趣的用户充分沟通,小红书推荐系统追求的是非全局效率最优,简言之就是“人以群分”,让每篇笔记内容、每位用户都能在自己的兴趣圈层进行交流。教授指出,传统的推荐系统基于有限的用户数据,通过过拟合的方式进行相似内容的分发,但其实无法真正了解用户的心智变化;我们需要打破公司内部的数据墙,将数据打通,实现多模态、长周期的全量用户数据分析,以便更好地理解用户行为和意图。
2023-04-19 13:12:03 1781
原创 小红书高时效推荐系统背后的技术升级
在小红书 APP 中,推荐系统的实效性对推荐效果有着特别重要的影响,特别是作为 UGC 平台,小红书的推荐系统如果能更快地捕捉用户与笔记之间的变化和联系,就能够给推荐带来更好的效果。在2021年上半年,首页推荐的召回、粗排、精排的主要模块都保持在天级更新的状态,我们通过持续迭代,将召回 CF 渠道、召回索引更新、召回模型/粗精排模型的训练都做到了分钟级更新,为首页推荐的分发效率带来飞跃式提升,并给业务侧带来非常显著的收益。小红书站内“最近一天内发布的新笔记”在首页的曝光占比一直很高,这段时间更是快速
2023-04-19 13:06:35 2006
原创 小红书广告智能创意能力构建过程详解
小红书社区内容以 UGC 为主,经验分享类的广告创意形式更贴合社区用户的消费习惯,也能获得更好的广告效果。如何帮助客户降低广告创意制作门槛,低成本、高效率、持续性制作大量优质广告创意,并合理进行广告创意优选和流量适配,是智能创意方向致力于解决的重点问题。经过一年多的探索与建设,我们构建了一套完整的广告创意生产与优选能力,帮助客户一站式投放广告创意。本文将介绍我们在小红书广告智能创意方向进行的能力构建和技术解决方案。在小红书,用户通过富媒体笔记分享和发现世界的精彩。商业广告作为小红
2023-04-19 10:57:29 624
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人