自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(87)
  • 收藏
  • 关注

原创 大模型和数据库最新结合进展

写在前面本文主要内容是上次接受 infoQ 访谈,百度智能云朱洁老师介绍了大模型和 AI 结合相关话题,这次整体再刷新下,给到对这个领域感兴趣的同学。

2024-06-28 16:44:39 835

原创 图数据库 vs 向量数据库

又称为仿生学派或生理学派,其主要原理为神经网络及神经网络间的连接机制与学习算法,深度神经网络解决的就是感知智能(人类的眼、耳、鼻、舌、身对环境的感知能力),现在的大模型就是连接主义的产物,但同时因为模型参数足够大,从感知智能又突破到了认知智能,甚至未来会走向 AGI(通用人工智能)。最近大模型出来之后,向量数据库重新翻红,业界和市场上有不少声音认为向量数据库会极大的影响图数据库,图数据库市场会萎缩甚至消失,今天就从技术原理角度来讨论下图数据库和向量数据库到底差别在哪里,适合什么场景,图数据库会不会消失。

2024-06-28 16:37:47 911

原创 大模型和数据库最新结合进展

写在前面本文主要内容是上次接受 infoQ 访谈,百度智能云朱洁老师介绍了大模型和 AI 结合相关话题,这次整体再刷新下,给到对这个领域感兴趣的同学。

2024-06-28 16:36:29 758

原创 一文把 RAG 每步的技术难点说明白

所以大家会看到要把 RAG 作为大模型应用目前主要落地场景,但还是有非常多改进的空间的,这方面的创业公司也很多,技术发展也很快,机会很多。RAG 技术从业务逻辑上来讲,是对大模型最新的知识的补充,所以 RAG 未来的空间,核心是企业私有化知识到底多不多,有没有用于业务价值的地方。根据现在调查,目前超过 80% 的落地应用基本都是 RAG,这个主要还是这块比较成熟,像大家期待的 Agent 技术还在发展中,没有特别成功的范例。还有处理更精细的,是按意图切分。最后的结果依赖大模型的理解,生成,逻辑推理能力。

2024-06-28 16:33:45 520

原创 snowflake 不再是个数据仓库公司了

标题先上结论,为啥这么认为,且听接下来道来。snowflake 非常成功,开创了云数仓先河,至今在数仓架构上也是相对比较先进的,国内一堆模仿的公司,传统上我们会认为 snowflake 肯定是一家数据仓库公司。不过最近这个认知被颠覆了。最近 youtube 上看了2024 snowflake summit,snowflake 搞了一大堆发布,主要做了三大块:1、数据(数仓,BI,分享)2、开发(构建,发布,Native APP,container)

2024-06-28 16:32:32 582

原创 边缘计算盒子是什么、有哪些作用?如何选型?这篇文章全面帮你了解!边缘计算云服务器ECS

比如,在工地场景下安装边缘盒子,内部的 AI 算法可以识别工地工人的安全帽佩戴、是否有烟雾、是否有人抽烟等危险事件,保证工地的安全。通过对零售店铺的实时数据进行智能分析,得出人脸+行为+轨迹等统计数据,管理端可以即时查看客流情况、客户属性、趋势及繁忙情况,基于分析结果来优化服务流程,提升运营效率和服务能力。通过将数据处理和计算能力直接部署在客户现场,减少数据传输的时间,这样可以高效完成数据处理,降低数据的延迟。百度智慧加油站基于边缘服务器,提供智能监管、作业督查的一体化方案,助力风险防控和规范作业管理。

2024-06-28 11:22:03 1174

原创 边缘计算节点 BEC 实践:如何快速准备裸金属服务器 Windows 自定义镜像?

很多小伙伴在某些场景下,需要基于 Windows 镜像的裸金属服务器创建自定义镜像,本文将介绍在进行裸金属服务器制作 Windows 自定义镜像前,你需要准备哪些内容、准备的步骤是怎么样的。在之前我们也发过 快速上手 PC-Farm 服务器的教程,欢迎大家查看边缘计算节点BEC典型实践:如何快速上手PC-Farm服务器?_pc farm-CSDN博客1、配置步骤打开powershell在 Windows 操作系统中,你可以通过以下几种方式打开 PowerShell:使用开始菜单:

2024-06-28 10:41:08 311

原创 十三年沉淀之路,百度智能云 Redis 服务背后的故事

当时,虽然 Redis 已经被广泛应用于各种场景,但社区版的 Redis 由于其单分片限制,已经无法满足日益增长的数据处理需求,而支持多分片就需要考虑负载均衡和读写分离的场景,因此通过自研的 proxy 以及支持 nshead 协议的实现,他们不仅实现了读写分离和负载均衡,还通过 Redis 的持久化机制,有效地缓解了缓存雪崩问题。未来,希望持续提升 Redis 产品的数据处理效率,融合 AI 技术,并支持云和边缘计算,为用户提供更优质稳定,高效智能的服务,保持行业领先地位。

2024-06-04 19:56:18 736

原创 深度解读大模型最火的智能体(Agent)

上周写了一篇文章,讲大模型两种模式,一种是 Copilot,一种是 Agent。

2024-06-04 19:52:07 917

原创 大模型 Copilot 和 Agent 有什么区别?

大模型发展到现在,对IT这个产业影响逐渐显现。搞应用的还没有赚到钱,卖铲子的英伟达发了,英伟达发布的最新的 Q1 财报,实现营收260亿美元,较去年同期增长262%,Q1净利润148.1亿美元,同比上升628%。也让英伟达的突破 1000 亿美金,市值超过 2.6 万亿美金。当能正常情况下,未来应用才是大头,应用这块各种新的概念也层出不穷,目前主流应用分两类,一类是 Copilot,一类是 Agent。那这两个分别是什么?对应有什么区别?本文简单来介绍下。

2024-05-29 10:37:02 1355

原创 一次性把“AI 原生应用技术栈”说明白

AI Agent 和大模型的区别在于,大模型与人类之间的交互是基于 prompt 实现的,用户 prompt 是否清晰明确会影响大模型回答的效果。阿里巴巴董事长蔡崇信在一个公开访谈中提到,国内整体实力比海外差,至少1~2 年以上,国内大公司创业公司卷模型的多,卷应用的少,相反海外创业公司卷应用更多。AI 当前有多火爆不用介绍了,随着各个厂商的努力,也慢慢浮现了有价值的应用,以及为更好的服务 AI 原始应用准备的各种平台产品。大模型如火如荼,相关技术日新月异,有兴趣的同学还可以看我前面的一些文章。

2024-05-29 10:32:39 1101

原创 GaiaDB:全球唯一支持多云的云原生数据库

传统没有融合之前,计算和存储是分开的,业界通用的一般使用 Raft 来实现存储数据可靠性,就像右上角图示一样,计算节点把数据发给存储节点 leader,存储节点 leader 收到之后,再发给follower,至少需要收到一个 follower 的确认,才返回成功,这个过程就需要至少两跳网络,而大家知道,整个计算机系统里面,网络是最慢的,网络的跳数越多,性能肯定就越低,怎么想办法降低网络传输路径是第一个优化的核心要点。很多大客户,也有多云的诉求,期望能有一个跨云平台的产品,就不用来回切换技术栈。

2024-04-19 11:13:45 804

原创 2024 云原生数据库发展现状和趋势

并且云原生数据库提供了又兼容又能扩展的能力,在存储层面实现了扩展的同时,又保留了计算层面的不变和兼容,从而基本实现了完全的兼容性。然而,云数据库并非专为云场景或云环境设计和构建的,它仅仅利用了云的资源。总而言之,在互联网和云计算快速发展的时代背景下,各行各业对于数据库的需求在不断增加和变化,随着这些新的需求越来越广泛地被提出,用户意识到采用传统单一的数据库来应对各类场景的时代已经过去,各厂商提供云原生数据库需要从多方位实现资源规格的灵活控制、应用的多模、更优的弹性扩展能力、更好的成本控制方式等。

2024-04-19 10:00:08 1082

原创 云数据库价格一瞥(华为云、百度智能云、腾讯云、阿里云)

最近,大家似乎和价格“磕”上了。本文仅考虑主流产品( RDS MySQL、Redis )的部分主流规格,对各家厂商的价格做一个对比,供参考。TL;DR:总体来看,各家云厂商价格趋于持平,部分主流商品百度智能云、华为云更便宜。RDS MySQL 的单机版本,意外的是百度智能云的价格明显最低,小规格几乎是其他厂商价格的三分之一。RDS MySQL 双机高可用通用规格,华为云的价格最低,百度云、腾讯云其次。

2024-04-09 11:53:11 2169 3

原创 云原生数据库 GaiaDB 支持新的管理工具啦

NineData 的加入丰富了GaiaDB数据生态服务,为双方开创了新的可能性。这一合作将持续提高数据管理的效率并增强数据安全性,为用户带来更优质的服务,使得用户可以更便捷地管理GaiaDB。我们期待更多的合作伙伴加入我们的百度智能云数据库生态,共同协助我们的用户不断提升数据管理的效能和安全性,以推动业务创新的持续发展。欢迎试用云原生数据库 GaiaDB_关系型数据库_MySQL上云_数据库-百度智能云。

2024-04-03 14:29:36 546

原创 云原生数据库的前世今生你了解多少?

例如用户之前使用集中式的 MySQL 数据库,随着业务增长需要选择扩展性更好的数据库产品,当前用户一般有两种技术路线,一种是分布式数据库,例如 TiDB、DRDS 等,这类数据虽然解决了大容量、高吞吐的扩展性问题,但一般在兼容性、延迟等方面有天然的短板;通过智能网络的选择和优化,回顾 MySQL 的发展和大流行,MySQL 之所以能成为广泛使用的数据库,主要原因在于其灵活的部署能力、稳定的性能、开源生态,以及被 Oracle 收购后,为其提供了丰富的企业级的能力,这使 MySQL 成为用户信赖的数据库。

2024-04-03 10:23:54 919

原创 国产向量数据库有哪些?VDB 来了!

向量数据库的性能,比如高 QPS、低延时等,使得业务能够更快的响应用户的查询请求,提供更流畅的使用体验。在 VDB后续版本更新中,我们将提供更全面的数据库企业级能力,集成更多的 AI 生态,成为一款为向量数据而生的专业向量数据库。如果您正在进行以下几类应用或业务的开发,比如基于大模型的知识处理、基于特性的相似性检索、NoSQL 类数据库应用等,可以尝试使用百度智能云 VDB,体验不一样的速度,以及丰富的企业级能力。向量数据库大致可以分为 2 部分:向量数据的检索,以及向量数据的存储和管理。

2024-03-27 17:20:23 631

原创 大模型时代下的 BI——智能问数

智能问数」是 Sugar BI 基于文心大语言模型推出的对话式数据问答产品,让用户能够通过自然语言的方式进行对答形式的数据查询,系统自动使用可视化图表的方式呈现数据结果,并支持对数据做summary总结。下面我将为大家展示如何使用智能问数功能,来辅助我们进行数据分析:恰当的提问描述可以帮助您更高效地获得想要的图表和结论,目前智能问数支持多种类型的提问,如简单指标类、时间筛选类、地域类和其他复杂类问题。下面举例说明了部分典型的提问类型,您可参照和使用类似的问题描述进行提问。

2024-03-12 17:28:58 1864

原创 2023 H1 中国边缘公有云服务市场 Top2,百度智能云加速推动分布式云智能化升级

同时推动全社会 AI 算力整合,在算力供给端和需求端之间建立起桥梁,满足 AI 原生时代的 AI 算力需求,实现 AI 普惠。为了帮助供给侧提升 AI 算力运营效率,同时为需求侧提供弹性灵活的 AI 算力,满足 AI 原生时代的算力要求,百度智能云推出了。中建设和中心云对齐的智能基础设施,这使得用户可以依据 AI 场景需要,在分布式云的框架内进行业务架构设计,比如中心训练与边缘推理,实现业务竞争力的提升。在 AI 原生时代,百度智能云不断升级和完善分布式云基础设施,实现全场景覆盖,让智算无处不在。

2024-02-23 17:08:45 846 1

原创 云数据库 Redis 性能深度评测(阿里云、华为云、腾讯云、百度智能云)

阿里云:整体性能排名第一,其中模型1中9/16个场景,模型3小Key读相关场景性能表现明显优于其它所有竞品百度智能云:全部29个场景中,9个场景排名第一,19个场景性能表现优于腾讯云与华为云;腾讯云:兼容Redis6.0,实际是1主1从3proxy部署架构,整体性能表现和华为差不多华为云:兼容Redis6.0, 1主1从部署,整体性能表现和腾讯差不多我们把测试数据加权之后,标准版的整体排名:阿里云(1.262)>百度智能云(1.053)>腾讯云(0.644)>华为云(0.537)

2024-02-20 15:42:33 1719

原创 补充TiDB与云原生数据库的性能比较,测试结果先诧异,之后懂了

SysBench 是一个跨平台且支持多线程的模块化基准测试工具,用于评估系统在运行高负载的数据库时相关核心参数的性能表现。可绕过复杂的数据库基准设置,甚至在没有安装数据库的前提下,快速了解数据库系统的性能。

2024-01-18 15:42:28 1344 1

原创 云数据库和本地数据库有什么区别呢?

云数据库和本地数据库的区别

2024-01-17 10:38:23 587

原创 为什么要使用云原生数据库?云原生数据库具体有哪些功能?

AWS Aurora提出来的 The log is the database的理念,实现存储计算分离,把大量的日志操作放到后台异步处理,实现存储独立扩展,这就解决了MySQL数据库最大的一个痛点,单库的数据量不能太大。云原生数据库在存储层面实现了扩展的同时,又保留了计算层面的不变和兼容,从而基本实现了完全的兼容性。高吞吐、大数据量处理:聚焦金融、电信等大量在线交易业务,商业级OLTP能力支撑银行核心系统高速事务,数据强一致无缝支持转账交易、账户查询、密码校验等业务;又具有自己独特的技术特点和架构。

2024-01-08 10:13:19 750

原创 数据库有哪些新方向?

同时,智能化的数据库运维工具也能够降低运维成本,提高数据库的可用性和可靠性。从数据库架构的角度来看,向云原生架构的演进是一个重要的趋势。综上所述,数据库的发展方向是多样化的,涵盖了架构、类型、负载和AI等多个方面。随着技术的不断进步,我们有理由相信,未来的数据库将会更加智能化、高效化和灵活化,为我们的生活和工作带来更多的便利和价值。除了数据库架构的演进,从数据库类型方面来看,多模态数据库的发展也越来越受到关注。此外,从负载方面来看,HTAP混合负载的演进也成为了数据库发展的重要方向。

2024-01-05 18:15:28 540

原创 分布式数据库 GaiaDB-X 通过 GB18030-2022《信息技术 中文编码字符集》最高级别认证

新版《信息技术 中文编码字符集》强制性国家标准于 2023 年 8 月 1 日正式实施,共收录汉字 87887 个,比上一版增加录入了 1.7 万余个生僻汉字,可覆盖我国绝大部分人名、地名用生僻字以及文献、科技等专业领域的用字,能够满足各类使用需求,为传承中华文化、增强中文信息处理能力、满足姓名生僻字人群用字需求提供强有力的标准保障。本次百度智能云 GaiaDB-X 产品以最高实现级别通过新国标认证,充分印证了百度智能云数据库高度满足各类系统的文字处理需求,能够为用户提供良好的中文使用体验。

2023-12-27 14:37:31 879

原创 云原生数据库性能对比(阿里云、百度智能云、腾讯云)

SysBench 是一个跨平台且支持多线程的模块化基准测试工具,用于评估系统在运行高负载的数据库时相关核心参数的性能表现。可绕过复杂的数据库基准设置,甚至在没有安装数据库的前提下,快速了解数据库系统的性能。

2023-12-27 14:33:47 1837 1

原创 云数据库性能深度测评与对比

谷歌云提供的RDS(在Google云叫Cloud SQL)选项比较简单,主要的选项中,仅有“Enterprise”版和“Enterprise Plus”版,这两个版本最主要的区别是“Plus”版提供了额外的“Data Cache能力”,该能力通过本地的SSD可以加速数据库更多的“冷”数据访问,关于这两个版本的详细说明可以参考之前的文章:Google Cloud SQL for MySQL的”Enterprise”和”Enterprise Plus”版本。在阿里云实例的购买过程中,还有一个参数模板的选项。

2023-12-19 15:38:55 1153 1

原创 云数据库与自建数据库有什么不同?

总体来说,部署在云端的服务(云服务器和云数据库)具有按需弹性扩展、轻松实现异地灾备、可远程管理及维护、TCO更低等优势。而本地物理机自建数据库虽然成本较高,但可以更好地满足业务定制化的需求。因此,在选择部署方式时,需要根据业务需求和实际情况进行综合考虑。「自购服务器搭建数据库服务」,涉及到云服务器和物理机服务器的选择。这两者之间存在一定的差别。首先,物理机服务器需要更多的部署及维护操作,而云服务器则通过虚拟化技术提供了更便捷的资源管理和弹性伸缩能力。

2023-12-08 10:44:49 513

原创 分布式数据库 GaiaDB-X 金融应用实践

接下来,我来分享百度智能云在金融方面的一些典型案例。首先是百信银行。它的特点是完全去 O,是一家完全没有 Oracle 的银行。全行 200+ 业务系统,无论是核心账务系统还是周边系统,几乎全部是基于。

2023-12-08 10:41:33 1495

原创 高性能和多级高可用,云原生数据库 GaiaDB 架构设计解析

GaiaDB 的存储节点支持数据页的回放功能,可以动态回放至任意目标版本后再返回,在之前的版本里,假如由于异步的因素还没有获取到这部分增量日志,存储节点也会启用优先拉取的策略实时拉取一次日志后再回放,以此来提供较好的时效性。所以在未来,这两个路线会不断融合。对于跨地域高可用来说,由于同样使用了异步并行加速的物理同步,及时在长距离传输上,吞吐依然可以追齐主集群,不会成为吞吐瓶颈,在计入网络延迟的情况下,国内可以实现数十毫秒的同步延迟,这是因为跨地域同样可以使用异步并行写加速,自动适应延迟和吞吐之间的关系。

2023-12-08 10:31:04 1507

原创 云原生数据库是什么?它的作用是啥?

一种是各大公有云厂商选择的,优先保证上云兼容性的路线,就是基于存算分离架构对传统数据库进行改造的路线:通过把大量的日志操作放到后台异步处理,实现存储独立扩展,解决了 MySQL 数据库单库的数据量不能太大的痛点。并且云原生数据库提供了又兼容又能扩展的能力,在存储层面实现了扩展的同时,又保留了计算层面的不变和兼容,从而基本实现了完全的兼容性。这样对于写负载本身需要较多计算资源的场景下会有很好的提升,但是由于事务和锁都需要跨网络进行交互,所以事务延迟是相对比较高的,在锁负载较重的负载下会成为一定的瓶颈。

2023-12-08 10:25:29 908

原创 从互联网到云计算再到 AI 原生,百度智能云数据库的演进

在数据库行业我们看到至少两个方向,一个是 AI4DB,其中包括阿里的 DAS、百度的 DSC 等,主要是通过 AI 的能力去改进原有数据库的自动化能力。在成本下降的同时,PegaDB 也兼容了 Redis 丰富的数据类型和命令,让用户做到无缝迁移,兼顾了用户体验和性能优势。AWS Aurora 提出来的 The log is the database 的理念,通过把大量的日志操作放到后台异步处理,实现了存储独立扩展和存储计算分离,从而解决了 MySQL 数据库单库的数据量不能太大的最大痛点。

2023-12-08 10:11:26 2111

原创 文心问数Sugar Bot :大模型+BI,多轮会话自动生成可视化图表与数据结论

Sugar BI 的文心问数功能是基于大语言模型实现的,支持您使用自然语言,通过多轮会话的方式,获取实时数据的图表展现,也可以自动为您总结与图表相关的业务结论。文心问数适用的场景有两个,分别是:场景1、文心问数页面,常用于业务最新情况的数据洞察。您可以在这个页面以问答的交互形式,向Sugar BI 提出业务问题,Sugar BI 将以图表的形式返回答案及业务结论。场景2、辅助您在报表/大屏的编辑页面进行页面编辑。

2023-08-23 10:41:30 3982

原创 边缘计算节点BEC典型实践:如何快速上手PC-Farm服务器?

如下图所示,用户可以使用NAT网关,让实例中的应用访问公网内容。通过给NAT网关配置相关的SNAT/DNAT规则,让虚机可以和外部网络进行通讯。

2023-08-17 20:04:34 1108

原创 Sugar BI : AI 问答,即问即答

AI 探索功能提供给所有用户自由探索和分析数据模型的能力。在 AI 探索页中,有授权的用户可以通过和两种方式对数据模型进行探索。

2023-07-28 11:23:11 256

原创 如何将各个阶段的数据进行对比?Sugar BI 教你快速搞定

折线图可以将当前和某个时间段的数据进行对比,比如前一天、上周、去年。

2023-07-11 15:39:15 957

原创 如何在可视化页面中保证数据安全?Sugar BI通过URL参数标识用户,灵活实现用户权限

公开分享之后的大屏/报表页面中,由于不需要用户登录账号,因此页面中这些需要用户登录账号才能进行的权限限制功能都不可用。但是在一些场景下,是期望这些权限功能在公开分享的页面中也生效的。因此我们设计了「分享页通过 URL 参数标识用户」的功能,本功能适用的场景如:在第三方系统中嵌入 Sugar BI 的大屏/报表分享页面,在用户不需要登录 Sugar BI 账号的情况,让行级别权限等权限限制功能也生效。

2023-07-06 17:43:47 215

原创 如何进行可视化的数据过滤?Sugar BI 的过滤组件教你快速实现

Sugar BI 中支持了 10+种过滤组件,这些过滤组件都是让用户在浏览报表或大屏的时候,能够交互式的对页面上的图表进行数据的过滤。所有过滤组件对图表的数据过滤设置都是一样的,如下:例如页面中已有两个图表(这两个图表使用的同一个数据模型),在页面上新增了一个「日期范围」类型的过滤条件,现在需要让日期范围对这两个图表进行数据的过滤。

2023-06-26 17:05:13 372

原创 什么是指标拆解树?指标拆解树怎么做数据分析?

我们先使用自定义拆解,本例中支持在地区省份城市三个维度中任意选择。依次选择地区省份城市对销售额指标进行拆解,效果如下图所示:节点过多展示不下时,可以单击箭头进行翻页:指标拆解树支持对节点大小、层级间距、高亮颜色,以及字体等进行配置:SugarBI支持免费试用,欢迎大家前来体验。

2023-06-15 17:14:25 1269

原创 Sugar BI 预测服务:快速通过机器学习,进行数据预测分析

机器学习是一门关于数据学习的科学技术,它能帮助机器从现有的复杂数据中学习规律,以预测未来的行为结果和趋势。Sugar BI 作为对数据进行分析的可视化平台,也支持用户对自己的数据使用机器学习算法进行探索试分析和趋势预测。

2023-05-29 16:57:38 493

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除