我是程序员
文章平均质量分 92
汇集阿里技术精粹!
阿里云云栖号
阿里云官网内容平台
展开
-
RocketMQ 5.0 架构解析:如何基于云原生架构支撑多元化场景
文章主要包含三部分内容。首先介绍 RocketMQ 5.0 的核心概念和架构概览;然后从集群角度出发,从宏观视角学习 RocketMQ 的管控链路、数据链路、客户端和服务端如何交互;最后介绍消息队列最重要的模块存储系统,了解 RocketMQ 如何实现数据的存储和数据的高可用,以及如何利用云原生存储进一步提升竞争力。原创 2023-08-16 17:26:44 · 578 阅读 · 0 评论 -
MaxCompute 发布按量付费闲时版,计算成本最高节省66.66%!
在大数据不断在追求计算效率和成本优化的背景下,阿里云云原生大数据计算服务 MaxCompute宣布推出按量付费闲时版,用户可选择用此版本完成时间不敏感的作业,从而降低计算成本,同等作业类型的计算费用与按量付费标准版相比,最高可实现66.66%的计算成本优化。原创 2023-08-16 15:36:44 · 531 阅读 · 0 评论 -
微服务最佳实践,零改造实现 Spring Cloud & Apache Dubbo 互通
本文以实际项目和代码为示例,一步一步演示如何以最低成本实现 Apache Dubbo 体系与 Spring Cloud 体系的互通,进而实现不同微服务体系的混合部署、迁移等,帮助您解决实际架构及业务问题。原创 2023-08-16 14:36:09 · 546 阅读 · 0 评论 -
一次网络不通“争吵”引发的思考
"你到底在说什么啊,我K8s的ecs节点要访问clb的地址不通和本地网卡有什么关系..." 气愤语气都从电话那头传了过来,这时电话两端都沉默了。过了好一会传来地铁小姐姐甜美的播报声打断了刚刚的沉寂「乘坐地铁必须全程佩戴口罩,下一站西湖文化广场...」。原创 2023-08-15 17:38:16 · 539 阅读 · 0 评论 -
阿里云故障洞察提效 50%,全栈可观测建设有哪些技术要点?
本文分享了阿里云可观测平台服务作为全球分布的超大业务系统,同时也作为服务全球企业用户的可观测平台提供方,在故障洞察提效中遇到的业务挑战,以及 6 个关键技术点和 2 个应用案例。原创 2023-08-15 15:38:19 · 558 阅读 · 0 评论 -
函数性能探测:更简单高效的 Serverless 规格选型方案
由于 Serverless 平台的扩缩容是基于请求处理/事件驱动的并发度进行扩缩容的,对于习惯基于 CPU 指标进行 Pod 水平扩缩的的开发者而言,就会遇到以下难题,比如并发度、最小实例数、最大实例数这几个参数之间的关系是什么样的?又比如单个实例最大并发度怎么设置,才能够符合自己的业务需求?原创 2023-08-15 14:11:29 · 542 阅读 · 0 评论 -
云原生 AI 工程化实践之 FasterTransformer 加速 LLM 推理
随着模型不断增大,计算量也达到了空前的高度,直接导致推理时间变长。为了解决大语言模型推理的延迟问题,业界已经提供了一些解决方案。本文将在 ACK 容器服务上,以 Bloom7B1 模型为例展示如何使用 FasterTransformer 进行推理加速。原创 2023-08-14 16:31:08 · 683 阅读 · 0 评论 -
聊聊数据库中的 savepoint
故事要从全局二级索引开始讲起。 当我们构建了一个全局二级索引之后,一条逻辑上的数据插入,就会变成两条物理上的数据插入:一条插入到主表,另一条插入到索引表。为了保证主表和索引表数据的一致性,我们往往需要开启分布式事务,再并行地插入两条数据。如果其中一条数据插入失败了,比如索引上出现了唯一键冲突,但主表的数据已经插了进去,怎么办呢?原创 2023-08-14 14:27:58 · 629 阅读 · 0 评论 -
PolarDB-X 针对跑批场景的思考和实践
金融行业和运营商系统,业务除了在线联机查询外,同时有离线跑批处理,跑批场景比较注重吞吐量,同时基于数据库场景有一定的使用惯性,比如直连MySQL分库分表的存储节点做本地化跑批、以及基于Oracle/DB2等数据库做ETL的数据清洗跑批等。原创 2023-08-14 13:59:13 · 633 阅读 · 0 评论 -
Apache Dubbo 云原生可观测性的探索与实践
Apache Dubbo3 在云原生可观测性方面完成重磅升级,使用 Dubbo3 最新版本,你只需要引入 dubbo-spring-boot-observability-starter 依赖,微服务集群即原生具备以下能力:1.可视化查看集群、单机流量指标与健康状态。2.全链路追踪。原创 2023-08-11 17:16:16 · 617 阅读 · 0 评论 -
Koordinator 异构资源/任务调度实践
本文分享了使用 Koordinator 支持异构资源管理和任务调度场景的实践经验。原创 2023-08-11 16:05:55 · 659 阅读 · 0 评论 -
如何基于 ACK Serverless 快速部署 AI 推理服务
在云原生场景下,是否有这样开箱即用、标准、开放的方案呢?答案是有。我们在 ACK Serverless 中提供 Knative + KServe 的方案,可以帮助用户快速部署 AI 推理服务,按需使用,在无请求时支持 GPU 资源自动缩容到 0,大幅节省 AI 应用场景下资源使用成本。原创 2023-08-10 16:12:20 · 634 阅读 · 0 评论 -
一文揭秘饿了么跨端技术的演进、实践与落地
本文会先带领大家一起简单回顾下跨端技术背景与演进历程与在这一波儿接着一波儿的跨端浪潮中的饿了么跨端现状,以及在这个背景下,相较于业界基于 React/Vue 研发习惯出发的各种跨端方案,饿了么为什么会选择走另外一条路,这个过程中我们的一些思考、遇到及解决的问题和取得的一些成果,希望能给大家带来一些跨端方面的新思路。原创 2023-08-10 10:35:55 · 728 阅读 · 0 评论 -
深入浅出流批一体理论篇——数据架构的演进
这篇文章的主要内容包括:1、数据架构的演变历史与各种架构的优缺点。2、流批一体的价值。3、流批一体架构中流与批的关系。原创 2023-08-09 15:22:26 · 756 阅读 · 0 评论 -
阿里云 MSE + ZadigX ,无门槛实现云原生全链路灰度发布
使用 MSE 进行灰度发布的过程中,ZadigX 可以便捷地创建灰度环境和灰度 K8S 资源,结合发布工作流编排能力,自动为 K8S 资源设置 MSE 所需的资源标记,并集成了 MSE API 以降低重复工作量。开发无需切换平台,管理员一次配置即可。原创 2023-08-09 14:52:36 · 665 阅读 · 0 评论 -
统一观测丨借助 Prometheus 监控 ClickHouse 数据库
本文旨在分享阿里云可观测监控 Prometheus 版对开源 ClickHouse 的监控实践。原创 2023-08-09 10:39:58 · 806 阅读 · 0 评论 -
闲置资源优化,轻松检查集群中的空闲成本
Kubernetes 提供了对计算、网络、存储资源的抽象,提升了集群资源管理的效率。然而,由于用户不需要直接管理底层资源,可能导致部分闲置资源未及时发现,造成成本浪费。原创 2023-08-08 15:15:28 · 600 阅读 · 0 评论 -
ChaosBlade 项目指南:我是如何为社区贡献 Redis 故障场景
Redis 实际使用过程中会存在一些故障演练需求。例如:模拟触发所有 key 过期的极端故障场景、模拟主动触发 Redis 内存淘汰策略释放内存场景等等。所以,根据以上故障演练需求,决定对 ChaosBlade 新增模拟 Redis 缓存过期实验和模拟 Redis 缓存内存限制实验,丰富 ChaosBlade 的混沌实验场景。原创 2023-08-08 14:11:47 · 731 阅读 · 0 评论 -
如何将个人 NAS 里的 Stable Diffusion 模型库挂载到 PAI-EAS
本文讲述如何将自己文件存储NAS里的Stable Diffusion文件挂载到PAI-EAS,实现模型的加载和推理训练。原创 2023-08-08 13:23:53 · 799 阅读 · 0 评论 -
手把手教你使用 OSS-HDFS 服务平替自建 HDFS
OSS-HDFS 服务是一款基于对象存储OSS之上的云原生数据湖3.0存储产品,基于统一的元数据管理能力,在完全兼容 HDFS 文件系统接口的同时,提供充分的 POSIX 能力支持,能更好的满足大数据和 AI 领域丰富多样的数据湖计算场景,只需要简的配置即可平替自建HDFS实现低成本、高弹性、高稳定的云上架构。原创 2023-08-07 16:32:11 · 940 阅读 · 0 评论 -
基于 ASM 简化可观测管理、提升业务洞察力
随着应用系统的复杂度越来越高,越来越难保证所有的系统都一直处于稳健状态,有可能某些部分会因问题而处于降级状态。因此我们不仅必须将应用程序构建得更可靠和更具弹性,还必须通过可观测性工具在运行时能够理解实际发生的事情。原创 2023-08-07 12:21:35 · 564 阅读 · 0 评论 -
程序员必须要知道的编程范式,你掌握了吗?
本文给大家介绍了什么是"编程范式",选择合适的编程范式可以提高代码的可读性、可维护性和可扩展性。原创 2023-08-03 14:51:13 · 1115 阅读 · 0 评论 -
一文详解 Spring Bean 循环依赖
本文主要梳理了Spring解决bean循环依赖的思路。原创 2023-08-02 16:05:21 · 1230 阅读 · 0 评论 -
金蝶管易云 X Hologres:新一代全渠道电商ERP最佳实践
通过本篇文章,我们将会介绍管易云ERP系统基于实时数仓的最佳实践,以帮助更多企业提升数据探查效率,促进业务的高效增长。原创 2023-08-02 14:54:19 · 790 阅读 · 0 评论 -
对比 5 个开源网关项目,这家 SaaS 企业如何统一网关架构
Higress 网关的落地,给企业全面落地云原生微服务架构提供强有力的支持,对我们技术人员来说,这绝对是一个杠杆级别的开源产品,另外,在阿里云上又有对等的 SaaS 产品,这样的配合,将公有云和私有化部署的统一网关一次性全部解决,对企业来说是绝对的利好。原创 2023-08-01 16:20:09 · 690 阅读 · 0 评论 -
快速玩转 Llama2!机器学习 PAI 最佳实践(三)—快速部署WebUI
本实践将采用阿里云机器学习平台PAI-EAS 模块针对 Llama-2-13B-chat 进行部署。PAI-EAS是模型在线服务平台,支持将模型一键部署为在线推理服务或AI-Web应用,具备弹性扩缩的特点,适合需求高性价比模型服务的开发者。原创 2023-08-01 14:07:33 · 1034 阅读 · 0 评论 -
快速玩转 Llama2!机器学习 PAI 最佳实践(二)—全参数微调训练
本实践将采用阿里云机器学习平台PAI-DSW模块针对 Llama-2-7B-Chat 进行全参数微调。PAI-DSW是交互式建模平台,该实践适合需要定制化微调模型,并追求模型调优效果的开发者。原创 2023-08-01 10:55:23 · 1374 阅读 · 0 评论 -
关于远程直接内存访问技术 RDMA 的高性能架构设计介绍
传统以太网方案存在系统调用消耗大量时间、增加数据传输延时、对 CPU 造成很重的负担三个缺点,而 RDMA 技术可以解决以上三个缺点。原创 2023-07-31 18:05:57 · 785 阅读 · 0 评论 -
政企云平台“一云多芯”路线全景图
“一云多芯”的重要性不言而喻,企业在设计和实施“一云多芯”策略时,要遵循怎样的路线?又要通盘考虑哪些问题?本文将通过阿里云在政企云平台“一云多芯”的实践经验,为政企落地一云多芯战略提供更多参考。原创 2023-07-31 15:16:34 · 803 阅读 · 0 评论 -
快速玩转 Llama2!机器学习 PAI 最佳实践(一)—低代码 Lora 微调及部署
本实践将采用阿里云机器学习平台PAI-快速开始模块针对 Llama-2-7b-chat 进行开发。PAI-快速开始支持基于开源模型的低代码训练、布署和推理全流程,适合想要快速开箱体验预训练模型的开发者。原创 2023-07-31 11:32:47 · 1204 阅读 · 0 评论 -
PolarDB-X 私有协议2.0
本文主要介绍私有协议2.0,也即XRPC的背景、总体设计、相关技术实现细节和性能测试结果。原创 2023-07-31 10:47:17 · 973 阅读 · 0 评论 -
面向未来的开源 OLAP 技术架构探讨以及选型实践
Delta Lake 在2019 年推出了增量数据湖格式,后期包括 Hudi,Iceberg,被大家称作数据湖三剑客。它们主要解决数据增量更新的问题。在大多情况下,作为 Presto、StarRocks 的外表,以读的方式作为 OLAP 来使用。原创 2023-07-27 16:20:09 · 723 阅读 · 0 评论 -
X-SIMD 高性能跨平台向量化加速库
X-SIMD适用于各种应用程序,例如数字信号处理、图像和视频处理、机器学习、科学计算等,这些应用软件属于计算密集型,需要处理大量的数据计算,往往会使用到SIMD进行优化。原创 2023-07-27 14:17:45 · 892 阅读 · 0 评论 -
快速玩转 Llama2!阿里云机器学习 PAI 推出最佳实践
近期,Meta 宣布大语言模型 Llama2 开源,阿里云机器学习平台PAI针对 Llama2 系列模型进行适配,推出全量微调、Lora微调、分布式训练、推理服务等场景最佳实践,助力AI开发者快速开箱。原创 2023-07-26 15:51:32 · 1038 阅读 · 0 评论 -
本地 IDC 中的 K8s 集群如何以 Serverless 方式使用云上计算资源
如果您不想维护云上节点池,您可以选择 Serverless 方式使用阿里云 ECI 弹性容器实例运行业务 Pod,更加高效弹性的使用云上 CPU/GPU 资源。原创 2023-07-26 14:30:39 · 750 阅读 · 0 评论 -
从互联网到云时代,Apache RocketMQ 是如何演进的?
为了解决电商业务对于消息队列的高性能、一致性、无限扩展等需求,自研消息队列成为了当时阿里唯一的出路,最终互联网消息队列 RocketMQ 应运而生。原创 2023-07-26 10:26:36 · 629 阅读 · 0 评论 -
全链路灰度的挑战、实现思路与解决方案
在传统的单体应用架构中,灰度发布相对简单。只需要在服务的流量入口处进行分流,通过使用 K8s Service 或各种类型的网关即可实现。然而,微服务架构引入了新的复杂性,服务之间的依赖关系错综复杂。有时候,某个功能的发布可能依赖于多个服务,要求灰度流量在整个调用链中准确路由到灰度版本的服务。原创 2023-07-25 15:47:07 · 861 阅读 · 0 评论 -
SpringCloud Gateway 在微服务架构下的最佳实践
微服务架构、微服务/API 网关这些关键词发展至今,早已不是什么新鲜的概念,技术选型者也从出于好奇心关注一个技术,转移到了更加关注这个技术的本质。市场上各类网关产品的功能也逐渐趋于同质化。原创 2023-07-25 14:35:55 · 773 阅读 · 0 评论 -
如何通过网关降低大模型的调用费用,并提升合规性
许多企业探索如何降低 AI 大模型的使用成本,通过网关进行 AI 大模型的 API 管理成为了很常规的需求。原创 2023-07-24 17:24:42 · 750 阅读 · 0 评论 -
记一次容器环境下出现 Address not available
pod 创建后一段时间一直是正常运行,突然有一天发现没有新的连接创建了,业务上是通过 pod A 访问 svc B 的 svc name 的方式,进入 pod 手动去 wget 一下,发现报错了 Address not available,为何会报错这个呢?原创 2023-07-24 13:38:20 · 785 阅读 · 0 评论