• 博客(404)
  • 收藏
  • 关注

转载 PaddleX图像分割赋能医疗领域筛查检测,打造智能医疗诊断系统

在医疗科技的前沿探索中,恶性皮肤肿瘤的早期识别与治疗显得至关重要。据2024年2月国家癌症中心发布的数据,中国恶性皮肤肿瘤的发病率已达2.4/10万,且每年新发病例约3.5万例[1]。尤其值得关注的是,晚期恶性皮肤肿瘤的生存率极低,例如黑色素瘤晚期的五年生存率仅4.6%,中位生存期不过1.42年,凸显了早期诊治的紧迫性[2]。然而,皮肤病变检测领域长期受专业门槛高、医疗资源分布不均的制约。

2024-09-23 19:33:29 118

原创 百度Android IM SDK组件能力建设及应用

即时通讯系统(Instant Messaging,简称IM系统)是一种允许用户通过互联网实时交换信息的通信技术。核心功能包括消息的发送与接收、用户状态的管理、消息、会话的存储与检索等。为了更好地满足用户更多场景诉求,IM系统还提供了如群组聊天、文件传输、语音和视频通话等功能。

2024-09-18 10:38:08 1869

转载 百度智能云向量数据库创新和应用实践分享

在大模型时代,数据库与大模型相互成就。我们也看到了很多新的趋势,从底层的 IaaS,模型会从云端扩展到端,PaaS 会从现在纯文本模型扩展到多模态,上层应用会从当前主流的 Copilot 扩展到 Agent,更充分利用大模型的自主决策能力。在向量检索这个场景中,存储的是非结构化数据,业务使用的越广泛,需要存储的数据就越多,因此在架构选型的时候,建议更早的预判到未来的业务增量,提前选择一个长期收益都很大的产品。我们会看到从客户场景角度,需要的是一个专业全面的能力的数据库,不是一个简单的插件可以完成的。

2024-09-12 10:06:09 305 1

原创 百度MEG数据开发治理平台-TDS

为实现这一目标,我们启动了第二阶段的开发,采用 Post-pretrain + SFT 对模型进行微调,结合BI分析工具的一些典型的打点日志,将用户查询的指标、维度、以及对应的筛选条件等整合后构建数据集在千帆平台进行大模型训练。模型提供的直观诊断报告,用通俗易懂的语言解释复杂的技术问题,大大降低了业务人员的学习及使用成本。TDS的数据任务涉及到众多业务线的基础数据产出,当这些任务出现异常时需要及时报警,TDS平台建立了一套完整的监控报警系统,当任务运行失败或出现异常时,进行及时的报警通告。

2024-09-10 10:47:42 1250

转载 键盘也能用上大模型?文心一言内置于罗技最新品

通过软硬件结合的立体式生态创新,罗技的用户现在可通过 Logi Options+自定义设置新品琥珀系列键盘上的快捷灵动键,更高效地调整他们的工作流程以满足特定需求,并使用/设定内置于 Logi Options+的 AI 相关功能,获得由百度文心一言提供的人工智能工具各类功能,例如文案创作、图像生成、学术论文辅助以及数据处理等。未来,为满足中国消费者的多样化需求,让用户可以根据自身喜好和应用场景,自由高效地选择 AI 服务,百度与罗技将继续携手并肩,共同探索人工智能技术应用的更多可能。

2024-09-05 10:16:14 184

原创 大模型在研发数据中台的应用实践

研发数据中台(性能中台)是一个专为APP性能追踪设计的一站式解决方案平台。通过先进的数据采集与监控技术,为APP提供实时、全链路的应用性能监控服务,助力APP提升线上问题排查与解决的效率。接入情况:覆盖了公司内部50多个APP、小程序、浏览器,以及外部收购的APP。服务规模:每日处理近千亿条研发数据,数据峰值达到30万QPS,核心业务端到端入库时间达到秒级别。业务可视化报表:针对通用化业务,提供例如问题概览、APP启动速度、用户分析等页面的可视化报表。业务宽表与数据集。

2024-09-03 10:36:57 1139

转载 飞桨框架3.0核心升级:动静统一自动并行,轻松开发大模型

框架的自动化流程主要有以下阶段:将用户标记的模型组网用分布式张量进行表示,然后进入切分推导流程为组网中的所有张量推导出一个合理高效的切分状态,接着框架的切分转换流程将为模型添加合适的通信算子 (详见下文2.2 章节),如果在静态图模式下还会基于静态图进行图优化提升训练性能 (详见下文4.1章节),最后用户可以保存或转换训练好的模型 checkpoint。例如,我们希望在6个计算设备上,创建一个形状为(4, 3)的分布式张量,其中沿着计算设备的 x 维,切分张量的0维;

2024-08-29 10:22:19 217

原创 百度搜索的RLHF性能优化实践

综上,我们在广泛实验、对比和学习了业界主流框架的情况下,通过分析RLHF任务的特点并采用先进的大模型预训练及推理性能优化手段,使得RLHF任务性能大幅提升,能够以相对少的资源支持了业务的快速迭代和发展,取得了良好的业务效果。

2024-08-27 11:59:38 1362 1

转载 基于飞桨框架实现PCA的人脸识别算法

主成分分析(PCA,Principal Component Analysis)是一项在高维数据中,寻找最重要特征的降维技术,大大减少数据的维度,而不显著损失信息量。本文将通过基于飞桨框架的实际代码示例,来展示所提供的高效、灵活的线性代数 API,如何简化机器学习和深度学习中的数据处理和分析工作,为高维数据集的处理和分析提供了有效工具。飞桨通过提供这些高效、灵活的线性代数 API,极大地简化了机器学习和深度学习中的数据处理和分析工作,为高维数据集的处理和分析提供了有效工具。

2024-08-22 15:17:07 58

原创 统一多场景自动编译加速——支持动态shape场景,一套架构搞定训推需求

通过飞桨神经网络编译器的自动优化,我们在生成式推理模型上相比基础版本,性能提升30%;在科学计算场景(Nvidia modulus)上, 基于飞桨提供的高阶自动微分及编译优化技术,对比 PyTorch 模型训练性能整体领先60%。

2024-08-20 10:07:48 1008

原创 基于飞桨框架的稀疏计算使用指南

本文将详细介绍如何在 PaddlePaddle 中利用稀疏计算应用稀疏 ResNet,涵盖稀疏数据格式的础知识、如何创建和操作稀疏张量,以及如何开发和训练稀疏神经网络模型。

2024-08-15 11:17:36 1025

原创 云高性能计算平台 CHPC 让企业的传统 HPC 玩出新花样

HPC 集群可以快速完成复杂计算,支撑模型仿真、数据分析等应用的高效运行,提高业务的创新速度,缩短产品上市时间。在很长的一段时间内,企业为了最大化提升市场竞争力,在传统的 HPC 集群上保持着不菲的资金投入,包括扩大集群规模、采购最新设备等方式。当前,如何在保障业务创新速度的同时,优化 HPC 集群的使用和运营方式以便减少资金投入,成为企业关注的重点。

2024-08-13 10:50:19 1154

原创 Embedding空间中的时序异常检测

在Embedding空间中实现高效的时序异常检测,通过向量化技术捕捉用户行为变化,有效应对复杂业务场景下的异常流量检测。

2024-08-08 10:17:55 699

原创 读友好的缓存淘汰算法

本文探讨了引入缓存解决高访盘吞吐的长尾。

2024-08-06 10:15:56 989

原创 如何定量分析 Llama 3,大模型系统工程师视角的 Transformer 架构

今天的分享主要从工程师的视角来剖析 Transformer 的整体架构

2024-08-01 10:13:44 491

原创 微服务架构革新:百度Jarvis2.0与云原生技术的力量

随着云计算和微服务架构的飞速发展,百度Jarvis2.0的诞生标志着一个新时代的到来。作为业界领先的广告技术平台,百度商业产品矩阵通过效果广告和展示广告两大类,以及基木鱼、观星盘等营销工具,为广告主提供了一个强大的营销生态系统。这些工具不仅帮助客户精准传达营销诉求,更是在广告检索系统中架起了一座桥梁,实现营销目标的高效达成。在广告存量竞争日趋激烈的今天,百度的商业产品不断演进,以小步快跑的方式,加速新功能的孵化与上线。

2024-07-30 10:14:02 419

原创 技术路线速通!用飞桨让京剧人物照片动起来

整体技术架构说明:基于飞桨框架的 PaddleHub 将戏剧人物与水墨画风格进行融合,接着使用 PaddleGAN 中的 FOM 模型进行视频人物的面部动作迁移融合,如下图所示。PaddleGAN 不仅为大家提供各类经典的生成对抗网络的复现及应用,同时还为大家准备好了各类项目的大合集,并且此项目将持续不断更新与补充,还希望大家持续关注 Repo–PaddleGAN!▎图像风格迁移****Python#安装paddlehub及其模型!# 下载模型%%capture!Python。

2024-07-25 10:11:35 1025

原创 无需业务改造,一套数据库满足 OLTP 和 OLAP,GaiaDB 发布并行查询能力

OLTP 数据库擅长处理数据的增、删、改,以及小数据量的查询,更侧重数据的实时响应、高吞吐和事务性等要求。OLAP 则以大数据量的复杂查询为主,更侧重数据容量的扩展性、复杂计算能力等要求。

2024-07-23 10:22:45 891

原创 Tensor 索引的使用指南及学习心得

本文章由飞桨 PFCC 社区成员卢畅贡献。卢畅,飞桨 PFCC成员,飞桨开源之星,飞桨开发者专家(PPDE),长期参加飞桨黑客松、护航计划等开源活动,参与过飞桨执行器预分析性能优化、静态图自动并行架构升级等任务。本期分享的主题是Tensor 索引。在深度学习的世界中,数据是一切算法和模型的基础。有效、高效地处理数据,特别是处理高维数组或张量(Tensor),成为了构建模型、处理数据等任务的重要部分。

2024-07-18 10:29:50 1098

原创 百度智能云将大模型引入网络故障定位的智能运维实践

本文将简单介绍百度智能云在物理网络故障定位的发展历程,然后详细分享如何基于大模型进行故障定位的最新实践。

2024-07-16 10:00:16 1249

原创 彻底解决网络哈希冲突,百度百舸的高性能网络 HPN 落地实践

GPU 的通信性能对于大模型的训练有着至关重要的影响。在 HPN 网络工程实践中,我们的核心关注点是如何充分利用网络硬件资源的能力,将通信性能最大化,从而提升大模型端到端的训练性能。

2024-07-11 10:10:17 471

原创 百度Feed业务数仓建模实践

本文介绍了 Feed 数仓宽表建模的演进过程和实践,使用流批一体的多版本宽表实现从实时到离线不同时效性、用户资源等多维度数据的数仓解决方案。

2024-07-09 10:28:05 993

原创 大模型时代数据库技术创新

本文整理自 2024 年 6 月 ArchSummit(深圳站) Data4AI 和 AI4Data 方面的探索和实践案例专题的同名主题分享。大家好,我今天讲的内容总共分为三部分,先是数据库和大模型的演变历程,尤其是两者的结合的过程。然后在分别介绍向量数据库,以及大模型在数据库运维应用结合的实践经验。

2024-07-04 10:05:31 1134

原创 低代码组件扩展方案在复杂业务场景下的设计与实践

本文主要介绍 NPM 组件扩展包的设计原理和开发实践。

2024-07-02 10:11:24 945

原创 通过搭建 24 点小游戏应用实战,带你了解 AppBuilder 的技术原理

由于大语言模型的技术原理仅是预测下一个词,因此单纯依靠提示词工程或指令微调来实现「随机出题」、「验证题目」、「解法推荐」这三个功能并不可靠。基于工具组件增强的大语言模型技术(Agent 技术)才是实现这个 24 点应用的有效方法。Agent 是一种设计模式,即通过自然语言驱动大语言模型决策要使用的工具,并能够根据工具执行的结果进行下一步决策。对于大部分简单任务来讲,都可以把任务分解为「思考模块」的定义和工具组件实现。其中,思考模块一般是一个思考模型。它并不一定是特殊的模型,也可以是一个普通的通用大模型。

2024-06-27 10:12:49 842

原创 基于 Native 技术加速 Spark 计算引擎

今天分享的主题是基于 Native 技术加速 Spark 计算引擎,大家将会了解到如何基于 ClickHouse 来改造 Spark 引擎,最终获得较为可观的性能提升。

2024-06-25 10:09:58 738

原创 百度&YY设计稿转代码的探索与实践

Figma & AI相结合生成开发代码的一站式解决方案。

2024-06-20 10:12:52 1093

原创 如何实现埋点日志精准监控

基于日志中台实时架构实现准确、可扩展、低成本的日志埋点监控。

2024-06-18 10:31:24 482

原创 从打点平台谈打点治理

本文从打点平台角度,描述日志中台在打点治理方面提供的解决方案与实践经验。

2024-06-14 11:18:46 1094

原创 手把手教你用Spring Boot搭建AI原生应用

文章详细介绍了 Spring AI 的使用方法,并将 Spring AI 与 Spring Boot 集成,结合检索增强生成技术,帮助读者轻松开发出一个 AI 原生应用。

2024-06-06 10:21:11 1407

原创 Baidu Comate帮开发者“代码搬砖”,2天搞定原先3周工作量

提升代码编写效率,助力医学影像数据处理项目提效。

2024-06-04 10:23:09 409

原创 用 Baidu Comate 实现研发提效,百度营销服务团队打造“轻舸”加速营销智能化

智能代码助手 Baidu Comate 助力产品 AI 原生重构。

2024-05-30 10:09:38 1383

原创 大模型效能工具之智能CommitMessage

本文阐述了一种大模型应用-智能CommitMessage小助手,帮你按照提交规范自动生成符合规范的CommitMessage, 告别CommitMessage的烦恼。

2024-05-23 11:45:10 1334

原创 从0到1:广告营销多智能体架构落地全攻略

在 AI Native(人工智能原生)时代,广告营销平台经历了根本性的变革,这些变化不仅提升了广告的效率和精准度,还重塑了广告行业的整体运作方式。

2024-05-21 11:28:15 596

原创 百度百舸 AIAK-LLM 的大模型训练和推理加速实践

今天主要给大家先分享分享百度百舸的「大模型训推任务加速套件 AIAK-LLM」 的内容。

2024-05-16 16:19:30 967

原创 解锁!智能代码助手 Baidu Comate 硬核能力

Baidu Comate 是百度基于文心大模型研发的智能代码助手,以插件的形式深度集成在 IDE 中,借助文心大模型强大的文本理解与生成能力,为每一个工程师提供一个7*24小时的 AI 编码助手。

2024-05-14 10:01:59 337

原创 大模型驱动的新一代 BI 平台,Sugar BI 开启智慧决策新模式

全文包括了可视化 BI 分析技术架构、智能图表推荐策略与规则设计、Sugar Bot 智能问数的技术实现流程,以及目前的场景应用等。

2024-05-09 10:43:55 460

原创 AI原生实践:测试用例创作探索

AI 技术不仅能重塑用例撰写过程,我们相信,未来 AI 还能辅助用例的执行、转化、更新和消亡等过程,进而为研发测试保质提效。

2024-05-07 09:54:50 1224

原创 一次性讲明白,如何搞定一个可以支持多芯混合训练的 AI 集群

本文讨论的重点:建设一个支持多芯混合训练的 AI 集群,并加速运行一个大模型训练任务。

2024-04-30 14:03:39 559

原创 百度沈抖:智能,生成无限可能

人人都是开发者,人人都是创造者。

2024-04-25 10:21:38 1723 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除