• 博客(386)
  • 收藏
  • 关注

原创 Tensor 索引的使用指南及学习心得

本文章由飞桨 PFCC 社区成员卢畅贡献。卢畅,飞桨 PFCC成员,飞桨开源之星,飞桨开发者专家(PPDE),长期参加飞桨黑客松、护航计划等开源活动,参与过飞桨执行器预分析性能优化、静态图自动并行架构升级等任务。本期分享的主题是Tensor 索引。在深度学习的世界中,数据是一切算法和模型的基础。有效、高效地处理数据,特别是处理高维数组或张量(Tensor),成为了构建模型、处理数据等任务的重要部分。

2024-07-18 10:29:50 982

原创 百度智能云将大模型引入网络故障定位的智能运维实践

本文将简单介绍百度智能云在物理网络故障定位的发展历程,然后详细分享如何基于大模型进行故障定位的最新实践。

2024-07-16 10:00:16 1151

原创 彻底解决网络哈希冲突,百度百舸的高性能网络 HPN 落地实践

GPU 的通信性能对于大模型的训练有着至关重要的影响。在 HPN 网络工程实践中,我们的核心关注点是如何充分利用网络硬件资源的能力,将通信性能最大化,从而提升大模型端到端的训练性能。

2024-07-11 10:10:17 407

原创 百度Feed业务数仓建模实践

本文介绍了 Feed 数仓宽表建模的演进过程和实践,使用流批一体的多版本宽表实现从实时到离线不同时效性、用户资源等多维度数据的数仓解决方案。

2024-07-09 10:28:05 933

原创 大模型时代数据库技术创新

本文整理自 2024 年 6 月 ArchSummit(深圳站) Data4AI 和 AI4Data 方面的探索和实践案例专题的同名主题分享。大家好,我今天讲的内容总共分为三部分,先是数据库和大模型的演变历程,尤其是两者的结合的过程。然后在分别介绍向量数据库,以及大模型在数据库运维应用结合的实践经验。

2024-07-04 10:05:31 1045

原创 低代码组件扩展方案在复杂业务场景下的设计与实践

本文主要介绍 NPM 组件扩展包的设计原理和开发实践。

2024-07-02 10:11:24 883

原创 通过搭建 24 点小游戏应用实战,带你了解 AppBuilder 的技术原理

由于大语言模型的技术原理仅是预测下一个词,因此单纯依靠提示词工程或指令微调来实现「随机出题」、「验证题目」、「解法推荐」这三个功能并不可靠。基于工具组件增强的大语言模型技术(Agent 技术)才是实现这个 24 点应用的有效方法。Agent 是一种设计模式,即通过自然语言驱动大语言模型决策要使用的工具,并能够根据工具执行的结果进行下一步决策。对于大部分简单任务来讲,都可以把任务分解为「思考模块」的定义和工具组件实现。其中,思考模块一般是一个思考模型。它并不一定是特殊的模型,也可以是一个普通的通用大模型。

2024-06-27 10:12:49 796

原创 基于 Native 技术加速 Spark 计算引擎

今天分享的主题是基于 Native 技术加速 Spark 计算引擎,大家将会了解到如何基于 ClickHouse 来改造 Spark 引擎,最终获得较为可观的性能提升。

2024-06-25 10:09:58 668

原创 百度&YY设计稿转代码的探索与实践

Figma & AI相结合生成开发代码的一站式解决方案。

2024-06-20 10:12:52 1044

原创 如何实现埋点日志精准监控

基于日志中台实时架构实现准确、可扩展、低成本的日志埋点监控。

2024-06-18 10:31:24 408

原创 从打点平台谈打点治理

本文从打点平台角度,描述日志中台在打点治理方面提供的解决方案与实践经验。

2024-06-14 11:18:46 1016

原创 手把手教你用Spring Boot搭建AI原生应用

文章详细介绍了 Spring AI 的使用方法,并将 Spring AI 与 Spring Boot 集成,结合检索增强生成技术,帮助读者轻松开发出一个 AI 原生应用。

2024-06-06 10:21:11 1074

原创 Baidu Comate帮开发者“代码搬砖”,2天搞定原先3周工作量

提升代码编写效率,助力医学影像数据处理项目提效。

2024-06-04 10:23:09 373

原创 用 Baidu Comate 实现研发提效,百度营销服务团队打造“轻舸”加速营销智能化

智能代码助手 Baidu Comate 助力产品 AI 原生重构。

2024-05-30 10:09:38 1332

原创 大模型效能工具之智能CommitMessage

本文阐述了一种大模型应用-智能CommitMessage小助手,帮你按照提交规范自动生成符合规范的CommitMessage, 告别CommitMessage的烦恼。

2024-05-23 11:45:10 1281

原创 从0到1:广告营销多智能体架构落地全攻略

在 AI Native(人工智能原生)时代,广告营销平台经历了根本性的变革,这些变化不仅提升了广告的效率和精准度,还重塑了广告行业的整体运作方式。

2024-05-21 11:28:15 521

原创 百度百舸 AIAK-LLM 的大模型训练和推理加速实践

今天主要给大家先分享分享百度百舸的「大模型训推任务加速套件 AIAK-LLM」 的内容。

2024-05-16 16:19:30 855

原创 解锁!智能代码助手 Baidu Comate 硬核能力

Baidu Comate 是百度基于文心大模型研发的智能代码助手,以插件的形式深度集成在 IDE 中,借助文心大模型强大的文本理解与生成能力,为每一个工程师提供一个7*24小时的 AI 编码助手。

2024-05-14 10:01:59 313

原创 大模型驱动的新一代 BI 平台,Sugar BI 开启智慧决策新模式

全文包括了可视化 BI 分析技术架构、智能图表推荐策略与规则设计、Sugar Bot 智能问数的技术实现流程,以及目前的场景应用等。

2024-05-09 10:43:55 426

原创 AI原生实践:测试用例创作探索

AI 技术不仅能重塑用例撰写过程,我们相信,未来 AI 还能辅助用例的执行、转化、更新和消亡等过程,进而为研发测试保质提效。

2024-05-07 09:54:50 1119

原创 一次性讲明白,如何搞定一个可以支持多芯混合训练的 AI 集群

本文讨论的重点:建设一个支持多芯混合训练的 AI 集群,并加速运行一个大模型训练任务。

2024-04-30 14:03:39 487

原创 百度沈抖:智能,生成无限可能

人人都是开发者,人人都是创造者。

2024-04-25 10:21:38 1698 1

原创 Prompt工程师压箱底绝活——Prompt的基本组成部分、格式化输出与应用构建

在大语言模型中,Prompt 的作用主要是给大语言模型提示输入信息的上下文和输入模型的参数信息。

2024-04-23 10:16:05 1337

原创 多元 CPU 性能调优的技术挑战、产品设计和业务实践

本文内容分三个部分:多元 CPU 性能调优的技术挑战;Btune 一键调优产品设计方案;百度智能云的调优实践。

2024-04-18 10:13:16 310

原创 基于afx透明视频的视觉增强前端方案

文章介绍了一种降低动效研发成本的视觉增强前端方案。

2024-04-16 11:27:29 1057

原创 百度一站式数据自助分析平台(TDA)建设

新一代自助分析BI,基于主题宽表实现自由拖拽分析,自定义生成仪表盘,一键订阅发送,辅助分析提效。

2024-04-11 10:10:50 1066

原创 浅析如何加速商业业务实时化

本文介绍了如何通过场景化端到端托管加速百度商业业务实时化取得增收

2024-04-09 11:19:05 295

原创 云原生数据库下一站:像 MySQL 一样流行,让更多人受益于新技术的发展

随着互联网的蓬勃发展,MySQL 等开源数据库掀起了一股浪潮。而云计算的崛起则标志着云数据库新时代的来临。

2024-04-07 18:47:36 988

原创 登录系统演进、便捷登录设计与实现

本文探讨登录认证技术的演进历程,并介绍在终端设备上实现便捷登录的设计与实现方法,以供各位同学参考。

2024-04-02 10:53:46 712

原创 百度智能云千帆,产业创新新引擎

本文整理自 3 月 21 日百度副总裁谢广军的主题演讲《百度智能云千帆,产业创新新引擎》。

2024-03-28 10:36:39 1443

原创 一文带你完整了解Go语言IO基础库

本文将帮助Golang学习的同学以完整,直观的方式掌握Golang的IO基础库的设计与使用

2024-03-26 11:45:49 787

原创 百度智能云加速「低代码+大模型」融合,爱速搭位居 2023 年 IDC 低代码/无代码领导者象限

凭借对企业级开发场景的深度支持,以及在 AI 原生开发平台领域的创新,百度智能云低代码平台爱速搭(下文简称:爱速搭)在该份报告中位居低代码/无代码开发平台的领导者象限。

2024-03-21 10:30:45 287

原创 百度交易中台之系统对账篇

本文主要介绍了百度交易中台“如何实现交易链路系统数据的一致性”的对账系统

2024-03-19 10:35:36 1843

原创 RAG一文读懂!概念、场景、优势、对比微调与项目代码示例

定义一个自定义的嵌入函数,用于将文本内容转换为嵌入向量。其中使用 ERNIE Bot 库来创建文本的嵌入,并且通过 Chromadb 库来管理这些嵌入向量。

2024-03-14 09:59:16 1579

原创 百度 Comate 提升编码效率,释放 10 倍软件生产力

目前,Comate 在「帮你想」、「帮你写」和「帮你改」三个方面发力。

2024-03-12 10:52:21 885

原创 专为大模型训练优化,百度集合通信库 BCCL 万卡集群快速定位故障

为了最大提升集合通信的性能,在基础设施层面,集群通常采用基于 RDMA 的高性能物理网络,在任务运行时使用集合通信库进行加速。

2024-03-07 10:30:30 1054

原创 分布式数据库 GaiaDB-X 金融应用实践

在新一代银行核心系统里面,整体的架构体系已经和互联网公司很接近了,大家用的都是相同的技术栈,只是服务的业务场景不同。在未来,银行业跟互联网业的技术交流会进一步紧密,人才的流动也会进一步频繁。

2024-03-05 10:30:45 1044

原创 揭秘百度数仓融合计算引擎

本文介绍了百度数仓融合计算引擎的整体设计原理、优化及实践,实现了提升查询性能的同时节约数仓存储的目标,大大降低了用户的数据使用成本。

2024-02-29 09:44:10 878

原创 教不会你算我输系列 | 手把手教你HarmonyOS应用开发

1月18日,华为宣布HarmonyOS NEXT版本预计在2024年Q2发布开发者Beta版,Q4发布面向消费者商用版,下面跟随作者我们手把手开发第一个纯血鸿蒙应用~

2024-02-27 11:15:01 1282

原创 漫谈数据分布可视化分析

在实际工作中,我们经常会遇到一堆数据,对数据的有效分析至为关键,而数据的分布就是一种非常重要的数据属性,需要通过合适的可视化手段进行分析。本文参考[1],基于seaborn库介绍一些常用的数据分布可视化方法。

2024-02-22 10:46:51 865

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除