自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

科技很有意思

是观点,还是故事?关注科技、互联网圈各种技术热点、八卦。

  • 博客(365)
  • 收藏
  • 关注

原创 云栖实录 | 阿里云 OpenLake 解决方案重磅发布:多模态数据统一纳管、引擎平权联合计算、数据共享统一读写

9月20日,2024云栖大会阿里云 OpenLake 解决方案重磅发布:多模态数据统一纳管、引擎平权联合计算、数据共享统一读写

2024-09-24 18:22:24 415

原创 AI Native平台,跨越AI应用从创新到生产的鸿沟

9月20日,2024云栖大会上,阿里云副总裁、阿里云计算平台事业部负责人汪军华宣布大数据AI平台全面升级,为 AI Native 应用大爆发提供坚实的平台支撑。

2024-09-23 09:38:58 973

原创 【Paper Reading】结合 NanoFlow 研究,优化大语言模型服务效率的探索

论文《NanoFlow:Towards Optimal Large Language Model Serving Throughput》提出了一种突破性的新型服务框架,旨在提高大语言模型在实际应用中的服务吞吐量。

2024-09-17 11:28:53 1073

原创 TAG:BladeLLM 的纯异步推理架构

BladeLLM 设计并实现了基于 Python 的纯异步 LLM 推理架构 -- TAG (Totally Asynchronous Generator) ,以最大程度提高 GPU 利用率,提升引擎性能。

2024-09-16 10:41:04 1120

原创 Flink Forward Asia 2024 议题征集令|探索实时计算新边界

Flink Forward Asia 2024 将于11月29日至30日在上海举行,现公开征集议题。

2024-09-14 09:34:14 813

原创 阿里云 EMR StarRocks 在七猫的应用和实践

本文介绍了七猫公司在其文化娱乐行业中如何利用阿里云提供的EMR StarRocks技术进行大数据处理和应用。

2024-09-13 09:26:30 1183

原创 Pai-Megatron-Patch:围绕Megatron-Core打造大模型训练加速生态

Pai-Megatron-Patch是阿里云人工智能平台PAI研发的围绕Nvidia MegatronLM的大模型开发配套工具,旨在帮助开发者快速上手大模型,完成大模型(LLM)相关的高效分布式训练,有监督指令微调,下游任务评估等大模型开发链路。

2024-09-12 09:47:06 846

原创 对接开源大模型应用开发平台最佳实践

本文以 Dify 为例介绍如何使用 OpenSearch LLM 智能问答版对接大模型应用开发平台构建 RAG 系统。

2024-09-11 09:24:40 1361

原创 阿里云Elasticsearch AI搜索实践

本文介绍了阿里云 Elasticsearch 在AI 搜索方面的技术实践与探索。

2024-09-10 09:24:52 1247

原创 提前锁定!2024云栖大会大数据AI参会攻略来啦

2024年9月19日~9月21日,一年一度的云栖大会又要与大家见面了。一文尽览大数据AI精彩预告,赶紧收藏吧!

2024-09-09 13:27:54 283

原创 首个大数据批流融合国家标准正式发布,阿里云为牵头起草单位!

国家市场监督管理总局、国家标准化管理委员会正式发布大数据领域首个批流融合国家标准 GB/T 44216-2024《信息技术 大数据 批流融合计算技术要求》,该标准由阿里云牵头起草,并将于2025年2月1日起正式实施。

2024-09-05 09:30:07 367

原创 成本最高可降40%!揭秘DataWorks资源组的Serverless进化之路

阿里云DataWorks为数据仓库/数据湖/湖仓一体等解决方案提供智能一站式开发治理平台能力。其中在资源组Serverless化方面,DataWorks实现了重大突破,不仅提高了资源利用率与灵活性,还降低了成本。

2024-09-04 09:33:12 729

原创 活动火热报名中|搜索进化论:基于大模型的企业级AI搜索

搜索进化论:基于大模型的企业级AI搜索活动火热报名中!!

2024-09-03 09:33:21 157

原创 RAG效果优化:高质量文档解析详解

本文介绍了如何通过高质量的文档解析提升RAG系统整体的效果。

2024-09-02 09:25:27 998

原创 大语言模型数据增强与模型蒸馏解决方案

本方案以通义千问2(Qwen2)大语言模型为基础,为您介绍大语言模型数据增强和蒸馏解决方案的完整开发流程。

2024-08-30 09:52:27 976

原创 阿里PAI-ChatLearn:大规模 Alignment高效训练框架正式开源

本文介绍了阿里云PAI团队开源的大规模Alignment高效训练框架PAI-ChatLearn。该框架旨在解决基于大型语言模型(LLM)的对话机器人(如ChatGPT)训练中的资源调度、模型并行处理和训练效率等问题。

2024-08-29 09:37:20 1216

原创 动手实践:如何高效构建企业级AI搜索

本文由阿里云搜索产品专家牛俊在【AI搜索TechDay】上的分享【阿里云AI搜索Demo展示和动手实践】整理而成。

2024-08-28 09:30:59 936

原创 【KDD2024】面向集群整体作业运行变慢的异常检测

阿里云计算平台大数据基础工程技术团队主导,与浙江大学合作的论文《Cluster-Wide Task Slowdown Detection in Cloud System》被数据挖掘领域顶会 ACM SIGKDD2024 接收

2024-08-27 09:27:05 881

原创 【KDD2024】大数据基础工程技术集群异常检测论文入选

阿里云计算平台大数据基础工程技术团队主导,与浙江大学合作的论文《Cluster-Wide Task Slowdown Detection in Cloud System》被数据挖掘领域顶会ACM SIGKDD2024接收

2024-08-26 09:39:46 609

原创 Elasticsearch 8 RAG 技术分享

本文介绍了Elasticsearch 8 在RAG场景方面的发展历程、技术演进、未来发展方向和产品能力。

2024-08-23 13:10:57 1136

原创 【ASPLOS2024】RECom:通过编译器技术加速推荐模型推理,论文中选并获得荣誉奖项!

关于推荐模型自动编译优化的论文《RECom: A Compiler Approach to Accelerate Recommendation Model Inference with Massive Embedding Columns》在系统领域顶会ASPLOS 2024上中选并进行了展示,并被授予了Distinguished Artifact Award 荣誉

2024-08-22 09:33:12 848

原创 Big Data for AI实践:面向AI大模型开发和应用的大规模数据处理套件

本文叙述的 Big Data for AI 最佳实践,基于阿里云人工智能平台PAI、MaxCompute自研分布式计算框架MaxFrame、Data-Juicer等产品和工具,实现了大模型数据采集、清洗、增强及合成大模型数据的全链路,解决企业级大模型开发应用场景的数据处理难题。

2024-08-21 09:46:05 1110

原创 【ACL2024】基于动态辅助融合的大模型序列编辑

阿里云人工智能平台PAI与集团安全部内容安全算法团队、华东师范大学何晓丰教授团队合作,在自然语言处理顶级会议ACL2024上发表论文

2024-08-20 09:37:48 675

原创 【ACL2024】基于长尾检索知识增强的大语言模型

阿里云人工智能平台PAI与阿里集团安全部内容安全算法团队、华东师范大学何晓丰教授团队合作,在自然语言处理顶级会议ACL2024上发表论文。

2024-08-19 09:31:32 1246

原创 【ACL2024】面向Stable Station的交互式多轮Prompt生成模型DiffChat

近日,与华南理工大学金连文教授团队合作,在自然语言处理顶级会议上发表论文。DiffChat算法是一个文到文的多轮生成模型,可以根据用户的需求指令对原始提示词进行适当的修改,得到新的提示词来使得文到图生成模型能够生成更美观且符合指令的图像。整个过程做到了用户和文图生成模型的迭代交互,最终完成用户的创作需求。

2024-08-16 10:12:01 838

原创 使用PAI × LLaMA Factory 微调 Llama3 模型

使用 PAI 平台及 LLaMA Factory 训练框架完成模型的中文化与角色扮演微调和评估,搭建专属“ AI 诸葛亮”问答机器人,7×24小时为你出谋划策!

2024-08-15 09:34:06 1063

原创 阿里云Elasticsearch 企业级AI搜索方案发布

本文从AI搜索落地的挑战、阿里云在RAG场景的实践、效果提升三个方面,深度解读阿里云Elasticsearch 企业级AI搜索方案。

2024-08-14 09:30:36 1114

原创 阿里云智能大数据演进

本文根据7月24日飞天发布时刻产品发布会、7月5日DataFunCon2024·北京站:大数据·大模型.双核时代实录整理而成

2024-08-13 09:40:53 1498

原创 【ACL2024】阿里云人工智能平台PAI多篇论文入选ACL2024

阿里云人工智能平台 PAI 的多篇论文在 ACL2024 上入选。论文成果是阿里云与阿里集团安全部、华南理工大学金连文教授团队、华东师范大学何晓丰教授团队共同研发。

2024-08-12 09:24:10 1287

原创 飞天发布时刻:大数据AI平台产品升级发布

7月24日,阿里云飞天发布时刻产品发布会围绕阿里云大数据AI平台的新能力和新产品进行详细介绍。人工智能平台PAI、云原生大数据计算服务MaxCompute、开源大数据平台E-MapReduce、实时数仓Hologres、阿里云Elasticsearch、向量检索Milvus等产品均带来了相关发布的深度解读。

2024-08-08 09:34:17 1200

原创 AI 点燃体育热情!使用 PAI-Artlab 定制专属海报

PAI ArtLab 是人工智能平台 PAI 为设计专业人士打造的 AIGC 智能设计工具,支持云端Stable Diffusion、Kohya 等主流文生图与模型训练应用,提供 AIGC 全场景能力。为了向在赛场上的奥运健儿传递最真挚的鼓舞与喝彩,我们特此发起一场别开生面的“创意海报设计挑战”!在 Artlab 平台 ComfyUI 工具中,选择你心中的奥运项目,定制一张专属于你的奥运会加油海报!

2024-08-07 16:58:14 172

原创 阿里云位居 IDC MarketScape 中国实时湖仓评估领导者类别

近日,国际数据公司( IDC)首次发布了《IDC MarketScape: 中国实时湖仓市场 2024 年厂商评估》(Doc# CHC51768224,2024年7月),阿里云在首次报告发布即位居领导者类别。

2024-08-06 09:41:46 288

原创 全新启航!阿里云向量检索服务Milvus版正式上线!

阿里云正式宣布向量检索服务Milvus版在杭州、上海、北京、深圳四大region正式可用并开放公测!这是由阿里云与产品生态合作伙伴Zilliz联合推出的一款业内领先的云原生向量检索引擎。

2024-08-05 09:38:30 949

原创 阿里云实时计算Flink在多行业的应用和实践

本文整理自 Flink Forward Asia 2023 中闭门会的分享。主要分享实时计算在各行业的应用实践,对回归实时计算的重点场景进行介绍以及企业如何使用实时计算技术,并且提供一些在技术架构上的参考建议。

2024-08-02 09:38:16 704

原创 多模态RAG:三步构建图文并茂的智能问答、电商导购助手

本文介绍了如何使用OpenSearch LLM智能问答版,三步搭建一站式多模态RAG系统。

2024-07-29 09:22:59 389

原创 实时数仓Hologres TPC-H及点查性能开箱测试

本次开箱测试主要通过96CU进行OLAP场景的TPC标准查询测试以及Serving场景会包含例如insert场景、update的场景,如果您也需要测试可以在官网购买59元150000CU时进行测试(1个96CU实例1小时消耗96CU时)

2024-07-26 09:17:44 919

原创 解读阿里云搜索开发工作台如何快速搭建AI语义搜索及RAG链路

本文介绍阿里云搜索开发工作台如何通过内置数据处理、查询分析、排序、效果测评、大模型等服务,结合阿里云搜索引擎及开源引擎,灵活打造AI语义搜索及RAG链路。

2024-07-25 09:48:17 1039

原创 客户案例 | 识货基于向量检索服务 Milvus 版搭建电商领域的向量数据检索平台

阿里云的Milvus服务以其性能稳定和功能多样化的向量检索能力,为识货团队在电商领域的向量检索场景中搭建业务系统提供了强有力的支持。该服务的分布式扩展能力不仅可靠,而且能够适应日益增长的数据规模。

2024-07-24 09:39:01 527

原创 分析性能提升40%,阿里云Hologres流量场景最佳实践

文章探讨了流量数据分析在互联网时代对企业决策的重要性,指出流量数据源于用户在APP、网站等平台的操作,经数据埋点采集、清洗和存储,成为实时数据仓库的基础。

2024-07-23 09:38:36 1112

原创 阿里云 EMR Serverless StarRocks OLAP 数据分析场景解析

本篇文章对阿里云EMR Serverless StarRocks OLAP 数据分析场景进行解析、存算分离架构升级以及 Trino 兼容,无缝替换介绍。

2024-07-22 09:35:41 780

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除