阿里云大数据AI技术
码龄5年
关注
提问 私信
  • 博客:395,486
    问答:459
    视频:354
    396,299
    总访问量
  • 420
    原创
  • 4,782
    排名
  • 2,408
    粉丝
  • 11
    铁粉

个人简介:分享阿里云计算平台的大数据和AI方向的技术创新、实战案例、经验总结。

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:北京市
  • 加入CSDN时间: 2020-06-10
博客简介:

科技很有意思

博客描述:
是观点,还是故事?关注科技、互联网圈各种技术热点、八卦。
查看详细资料
  • 原力等级
    当前等级
    7
    当前总分
    3,680
    当月
    124
个人成就
  • 获得3,197次点赞
  • 内容获得22次评论
  • 获得3,606次收藏
  • 代码片获得316次分享
创作历程
  • 12篇
    2025年
  • 160篇
    2024年
  • 127篇
    2023年
  • 98篇
    2022年
  • 26篇
    2021年
成就勋章
TA的专栏
  • 学术论文
    33篇
  • 开源技术
    32篇
  • 2024 云栖大会
    9篇
TA的推广
兴趣领域 设置
  • 大数据
    flinkodps大数据数据仓库
  • 人工智能
    计算机视觉机器学习人工智能自然语言处理图像处理
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

有救了!泼天的流量用最大的数据湖

阿里云数据湖构建(Data Lake Formation,简称 DLF)提供了百 PB 级数据湖上云与迁移的能力。通过标准化产品能力实现存量数据数百 PB,增量数据数 PB 大规模数据湖上云,解决各类小文件等性能问题,数据同步持续保持较高带宽利用率,保障项目进度。
原创
发布博客 2025.01.20 ·
871 阅读 ·
16 点赞 ·
0 评论 ·
20 收藏

BladeDISC++:Dynamic Shape AI 编译器下的显存优化技术

本文将介绍阿里云 PAI 团队近期发布的 BladeDISC++项目,探讨在动态场景下如何优化深度学习训练任务的显存峰值,
原创
发布博客 2025.01.17 ·
659 阅读 ·
19 点赞 ·
0 评论 ·
27 收藏

阿里云 EMR 发布托管弹性伸缩功能,支持自动调整集群大小,最高降本60%

阿里云开源大数据平台 E-MapReduce 推出托管弹性伸缩功能,结合 ECS 容器化部署优势,实现灵活配置与管理 EMR 集群。该功能支持根据业务需求自动调整计算能力,EMR 会依据工作负载关键指标自动调整集群规模,确保最佳性能与资源利用率。
原创
发布博客 2025.01.16 ·
1042 阅读 ·
13 点赞 ·
0 评论 ·
19 收藏

面向法律场景的大模型RAG检索增强解决方案

检索增强生成模型结合了信息检索与生成式人工智能的优点,从而在特定场景下提供更为精准和相关的答案。以人工智能平台 PAI 为例,为您介绍在云上使用一站式白盒化大模型应用开发平台 PAI-LangStudio 构建面向法律场景的大模型 RAG 检索增强解决方案。
原创
发布博客 2025.01.15 ·
1216 阅读 ·
13 点赞 ·
0 评论 ·
20 收藏

数据分析经典案例重现:使用DataWorks Notebook 实现Kaggle竞赛之房价预测,成为数据分析大神!

本文详细介绍了如何使用阿里云 DataWorks Notebook 来实现 Kaggle 竞赛中的房价预测任务,提供了一个完整的实践指南,旨在帮助读者通过这一案例掌握房价预测的基本分析流程。
原创
发布博客 2025.01.13 ·
708 阅读 ·
6 点赞 ·
0 评论 ·
11 收藏

云上一键部署 DeepSeek-V3 模型,阿里云PAI Model Gallery 最佳实践

本文介绍了如何在阿里云 PAI 平台上一键部署 DeepSeek-V3 模型,通过这一过程,用户能够轻松地利用 DeepSeek-V3 模型进行实时交互和 API 推理,从而加速 AI 应用的开发和部署。
原创
发布博客 2025.01.10 ·
1279 阅读 ·
24 点赞 ·
0 评论 ·
14 收藏

【最佳实践】蚂蚁基于 MaxCompute 动态过滤器优化小表 JOIN 大表节省70%CPU 消耗

在蚂蚁商家账单离线产出时效提升项目中,通过 MaxCompute 产品提供的动态过滤器结合 Hash Clustering 表能力,在小表 JOIN 大表的场景下实现将在 JOIN 前尽可能多的过滤数据,减少了95%以上大表被扫描到的文件数,并大幅度提升 SQL 运行速度,最终减少了70%的 CPU 消耗和磁盘 IO 量。
原创
发布博客 2025.01.09 ·
734 阅读 ·
29 点赞 ·
0 评论 ·
9 收藏

阿里云 AI 搜索方案解读:大模型驱动下的智能搜索,助力企业数字化转型

阿里云ES最新推出的8.15版本,是基于最新的内核,推出的向量增强版。此版本在性能上相较于8.9版本性能提升了五倍以上,支持数据量化,能显著降低内存存储成本75%。此外,该版本原生支持向量检索,不需通过插件实现,同时支持多路融合排序算法,提高了向量搜索与传统搜索结果的融合效果。此版本还支持与AI 搜索开放平台的无缝结合。智能客服:通过自然语言处理,智能客服能够快速响应客户查询,提供准确的信息。例如,客户可以询问退款政策或快递状态,系统能够即刻给出相关答案,提升客户满意度。企业内部知识库。
原创
发布博客 2025.01.08 ·
1207 阅读 ·
21 点赞 ·
0 评论 ·
24 收藏

活动火热报名中 | Data+AI 融合趋势下的智能数仓平台建设

本次活动,我们将聚焦“Data+AI融合趋势下的智能数仓平台建设”,诚邀您与阿里云技术专家及众多业内大咖面对面,探讨 MaxCompute 智能数仓近期推出的核心功能和最佳实践,为大数据和 AI 从业者提供一个开放的分享与交流平台。
原创
发布博客 2025.01.08 ·
267 阅读 ·
1 点赞 ·
0 评论 ·
1 收藏

跨越鸿沟:PAI-DSW 支持动态数据挂载新体验

本文讲述了如何在 PAI-DSW 中集成和利用 Fluid 框架,以及通过动态挂载技术实现 OSS 等存储介质上数据集的快速接入和管理。通过案例演示,进一步展示了动态挂载功能的实际应用效果和优势。
原创
发布博客 2025.01.06 ·
618 阅读 ·
23 点赞 ·
0 评论 ·
22 收藏

动态挂载公共数据集训练Qwen2.5

发布视频 2025.01.06

面向教育场景的大模型 RAG 检索增强解决方案

以人工智能平台 PAI 为例,为您介绍在云上使用一站式白盒化大模型应用开发平台 PAI-LangStudio 构建面向教育场景的大模型 RAG 检索增强解决方案,应用构建更简便,开发环境更直观。
原创
发布博客 2025.01.03 ·
758 阅读 ·
13 点赞 ·
0 评论 ·
27 收藏

从企业级 RAG 到 AI Assistant,阿里云 Elasticsearch AI 搜索技术实践

阿里云 Elasticsearch 推出的创新型 AI 搜索方案,使用 RAG 技术对检索增强生成的各个环节进行能力增强,并深度融合了企业版 AI Assistant,将 RAG 技术应用于 AI Ops 领域。
原创
发布博客 2025.01.02 ·
913 阅读 ·
26 点赞 ·
0 评论 ·
21 收藏

阿里云技术公开课:基于阿里云 Elasticsearch 构建 AI 搜索和可观测 Chatbot

本次公开课我们将深入探讨如何构建高效的AI技术解决方案,Elastic和阿里云搜索技术专家将深入解读阿里云Elasticsearch Enterprise版的AI功能及其在实际应用。
原创
发布博客 2024.12.27 ·
614 阅读 ·
2 点赞 ·
0 评论 ·
4 收藏

超值选择:阿里云Elasticsearch Serverless在企业数据检索与分析中的高性能与灵活性

Elasticsearch Serverless 服务是基于云原生 Serverless 技术架构构建的 Elasticsearch 服务化产品,完美兼容 Elasticsearch 原生 API 及其生态系统。为用户提供简单易用、灵活弹性的 Elasticsearch 体验,无需管理集群资源和配置,便可实现负载与资源的动态匹配。
原创
发布博客 2024.12.25 ·
779 阅读 ·
24 点赞 ·
0 评论 ·
26 收藏

面向医疗场景的大模型 RAG 检索增强解决方案

检索增强生成模型结合了信息检索与生成式人工智能的优点,从而在特定场景下提供更为精准和相关的答案。以人工智能平台 PAI 为例,为您介绍在云上构建面向医疗场景的大模型 RAG 检索增强解决方案。
原创
发布博客 2024.12.24 ·
766 阅读 ·
19 点赞 ·
0 评论 ·
22 收藏

阿里云技术公开课直播预告:基于阿里云 Elasticsearch 构建 AI 搜索和可观测 Chatbot

本次公开课我们将深入探讨如何构建高效的AI技术解决方案,Elastic和阿里云搜索技术专家将深入解读阿里云Elasticsearch Enterprise版的AI功能及其在实际应用。
原创
发布博客 2024.12.23 ·
1093 阅读 ·
9 点赞 ·
0 评论 ·
29 收藏

通过阿里云 Milvus 与 PAI 搭建高效的检索增强对话系统

文章详细描述了从创建Milvus实例、配置PAI服务到使用RAG WebUI上传知识库和进行对话测试的操作流程,以及如何使用Attu工具查看向量数据库中的知识库切块。
原创
发布博客 2024.12.20 ·
1265 阅读 ·
18 点赞 ·
0 评论 ·
13 收藏

MaxCompute Bloomfilter index在蚂蚁安全溯源场景大规模点查询的最佳实践

MaxCompute 作为阿里自主研发的具有业界领先水平的分布式大数据处理平台, 尤其在集团内部得到广泛应用,支撑了多个 BU 的核心业务。 MaxCompute 在致力于提升 SQL 语言的用户体验和表达能力的同时,也在持续进行性能优化,并推出更多的功能提高广大 ODPS 客户的生产力和生产效率。
原创
发布博客 2024.12.18 ·
1161 阅读 ·
22 点赞 ·
0 评论 ·
15 收藏

重磅发布 | OpenSearch 推出向量检索 GPU 图算法方案并支持 GPU 规格售卖

阿里云OpenSearch向量检索版推出GPU图算法方案(CAGRA算法),支持GPU加速,并支持直接购买GPU规格节点。作为国内云上首家支持GPU规格的向量检索产品,OpenSearch提供了近10倍的向量搜索性能提升,适合高QPS业务场景。
原创
发布博客 2024.12.18 ·
605 阅读 ·
13 点赞 ·
0 评论 ·
27 收藏
加载更多