- 博客(386)
- 收藏
- 关注
原创 Tensor 索引的使用指南及学习心得
本文章由飞桨 PFCC 社区成员卢畅贡献。卢畅,飞桨 PFCC成员,飞桨开源之星,飞桨开发者专家(PPDE),长期参加飞桨黑客松、护航计划等开源活动,参与过飞桨执行器预分析性能优化、静态图自动并行架构升级等任务。本期分享的主题是Tensor 索引。在深度学习的世界中,数据是一切算法和模型的基础。有效、高效地处理数据,特别是处理高维数组或张量(Tensor),成为了构建模型、处理数据等任务的重要部分。
2024-07-18 10:29:50 982
原创 百度智能云将大模型引入网络故障定位的智能运维实践
本文将简单介绍百度智能云在物理网络故障定位的发展历程,然后详细分享如何基于大模型进行故障定位的最新实践。
2024-07-16 10:00:16 1151
原创 彻底解决网络哈希冲突,百度百舸的高性能网络 HPN 落地实践
GPU 的通信性能对于大模型的训练有着至关重要的影响。在 HPN 网络工程实践中,我们的核心关注点是如何充分利用网络硬件资源的能力,将通信性能最大化,从而提升大模型端到端的训练性能。
2024-07-11 10:10:17 407
原创 百度Feed业务数仓建模实践
本文介绍了 Feed 数仓宽表建模的演进过程和实践,使用流批一体的多版本宽表实现从实时到离线不同时效性、用户资源等多维度数据的数仓解决方案。
2024-07-09 10:28:05 933
原创 大模型时代数据库技术创新
本文整理自 2024 年 6 月 ArchSummit(深圳站) Data4AI 和 AI4Data 方面的探索和实践案例专题的同名主题分享。大家好,我今天讲的内容总共分为三部分,先是数据库和大模型的演变历程,尤其是两者的结合的过程。然后在分别介绍向量数据库,以及大模型在数据库运维应用结合的实践经验。
2024-07-04 10:05:31 1045
原创 通过搭建 24 点小游戏应用实战,带你了解 AppBuilder 的技术原理
由于大语言模型的技术原理仅是预测下一个词,因此单纯依靠提示词工程或指令微调来实现「随机出题」、「验证题目」、「解法推荐」这三个功能并不可靠。基于工具组件增强的大语言模型技术(Agent 技术)才是实现这个 24 点应用的有效方法。Agent 是一种设计模式,即通过自然语言驱动大语言模型决策要使用的工具,并能够根据工具执行的结果进行下一步决策。对于大部分简单任务来讲,都可以把任务分解为「思考模块」的定义和工具组件实现。其中,思考模块一般是一个思考模型。它并不一定是特殊的模型,也可以是一个普通的通用大模型。
2024-06-27 10:12:49 796
原创 基于 Native 技术加速 Spark 计算引擎
今天分享的主题是基于 Native 技术加速 Spark 计算引擎,大家将会了解到如何基于 ClickHouse 来改造 Spark 引擎,最终获得较为可观的性能提升。
2024-06-25 10:09:58 668
原创 手把手教你用Spring Boot搭建AI原生应用
文章详细介绍了 Spring AI 的使用方法,并将 Spring AI 与 Spring Boot 集成,结合检索增强生成技术,帮助读者轻松开发出一个 AI 原生应用。
2024-06-06 10:21:11 1074
原创 用 Baidu Comate 实现研发提效,百度营销服务团队打造“轻舸”加速营销智能化
智能代码助手 Baidu Comate 助力产品 AI 原生重构。
2024-05-30 10:09:38 1332
原创 大模型效能工具之智能CommitMessage
本文阐述了一种大模型应用-智能CommitMessage小助手,帮你按照提交规范自动生成符合规范的CommitMessage, 告别CommitMessage的烦恼。
2024-05-23 11:45:10 1281
原创 从0到1:广告营销多智能体架构落地全攻略
在 AI Native(人工智能原生)时代,广告营销平台经历了根本性的变革,这些变化不仅提升了广告的效率和精准度,还重塑了广告行业的整体运作方式。
2024-05-21 11:28:15 521
原创 解锁!智能代码助手 Baidu Comate 硬核能力
Baidu Comate 是百度基于文心大模型研发的智能代码助手,以插件的形式深度集成在 IDE 中,借助文心大模型强大的文本理解与生成能力,为每一个工程师提供一个7*24小时的 AI 编码助手。
2024-05-14 10:01:59 313
原创 大模型驱动的新一代 BI 平台,Sugar BI 开启智慧决策新模式
全文包括了可视化 BI 分析技术架构、智能图表推荐策略与规则设计、Sugar Bot 智能问数的技术实现流程,以及目前的场景应用等。
2024-05-09 10:43:55 426
原创 AI原生实践:测试用例创作探索
AI 技术不仅能重塑用例撰写过程,我们相信,未来 AI 还能辅助用例的执行、转化、更新和消亡等过程,进而为研发测试保质提效。
2024-05-07 09:54:50 1119
原创 一次性讲明白,如何搞定一个可以支持多芯混合训练的 AI 集群
本文讨论的重点:建设一个支持多芯混合训练的 AI 集群,并加速运行一个大模型训练任务。
2024-04-30 14:03:39 487
原创 Prompt工程师压箱底绝活——Prompt的基本组成部分、格式化输出与应用构建
在大语言模型中,Prompt 的作用主要是给大语言模型提示输入信息的上下文和输入模型的参数信息。
2024-04-23 10:16:05 1337
原创 多元 CPU 性能调优的技术挑战、产品设计和业务实践
本文内容分三个部分:多元 CPU 性能调优的技术挑战;Btune 一键调优产品设计方案;百度智能云的调优实践。
2024-04-18 10:13:16 310
原创 云原生数据库下一站:像 MySQL 一样流行,让更多人受益于新技术的发展
随着互联网的蓬勃发展,MySQL 等开源数据库掀起了一股浪潮。而云计算的崛起则标志着云数据库新时代的来临。
2024-04-07 18:47:36 988
原创 百度智能云加速「低代码+大模型」融合,爱速搭位居 2023 年 IDC 低代码/无代码领导者象限
凭借对企业级开发场景的深度支持,以及在 AI 原生开发平台领域的创新,百度智能云低代码平台爱速搭(下文简称:爱速搭)在该份报告中位居低代码/无代码开发平台的领导者象限。
2024-03-21 10:30:45 287
原创 RAG一文读懂!概念、场景、优势、对比微调与项目代码示例
定义一个自定义的嵌入函数,用于将文本内容转换为嵌入向量。其中使用 ERNIE Bot 库来创建文本的嵌入,并且通过 Chromadb 库来管理这些嵌入向量。
2024-03-14 09:59:16 1579
原创 专为大模型训练优化,百度集合通信库 BCCL 万卡集群快速定位故障
为了最大提升集合通信的性能,在基础设施层面,集群通常采用基于 RDMA 的高性能物理网络,在任务运行时使用集合通信库进行加速。
2024-03-07 10:30:30 1054
原创 分布式数据库 GaiaDB-X 金融应用实践
在新一代银行核心系统里面,整体的架构体系已经和互联网公司很接近了,大家用的都是相同的技术栈,只是服务的业务场景不同。在未来,银行业跟互联网业的技术交流会进一步紧密,人才的流动也会进一步频繁。
2024-03-05 10:30:45 1044
原创 揭秘百度数仓融合计算引擎
本文介绍了百度数仓融合计算引擎的整体设计原理、优化及实践,实现了提升查询性能的同时节约数仓存储的目标,大大降低了用户的数据使用成本。
2024-02-29 09:44:10 878
原创 教不会你算我输系列 | 手把手教你HarmonyOS应用开发
1月18日,华为宣布HarmonyOS NEXT版本预计在2024年Q2发布开发者Beta版,Q4发布面向消费者商用版,下面跟随作者我们手把手开发第一个纯血鸿蒙应用~
2024-02-27 11:15:01 1282
原创 漫谈数据分布可视化分析
在实际工作中,我们经常会遇到一堆数据,对数据的有效分析至为关键,而数据的分布就是一种非常重要的数据属性,需要通过合适的可视化手段进行分析。本文参考[1],基于seaborn库介绍一些常用的数据分布可视化方法。
2024-02-22 10:46:51 865
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人