ModaHub魔搭社区
大禹智库——致力于AIGC,向量数据库和低代码研究与顾问咨询。代表作《实战AI大模型》,《向量数据库指南》,《低代码指南》
展开
-
中国最具影响力的TOP20低代码开发平台排行榜——LCHub
LCHub低代码开发平台排行榜原创 2021-12-04 14:42:31 · 4404 阅读 · 0 评论 -
《向量数据库指南》——AI应用长文本与RAG技术爬坡
另外一部分是online 的部分, online 的时候就是用户要过来查这个书了,那怎么能够快速把这书找到,依赖于线下做的事情,然后这两块现在都有进化,都有新的技术栈的加入,整体来看实现效果包括应用情况也比 6 个月之前要好了很多。大语言模型的进展除了长文本本身之外,包括推理和逻辑的能力也在提升,然后就出现了用大语言模型去解析query语义,将其拆成多步,甚至产生了是交互式的问题解答,即先解答一步,然后根据该步的返回的情况,再让大语言模型去决后面一步要解决什么样的问题。主要是延迟特别高,或者精度特别的差。原创 2024-08-19 20:00:00 · 62 阅读 · 0 评论 -
《向量数据库指南》——Dopple LAbs:展望未来:构建多模态交互的尖端体验
Dopple LAbs正以坚定的步伐,向着构建一个全面、沉浸式的多模态交互未来迈进。通过不断的技术创新与合作,他们正逐步打破虚拟与现实的界限,为用户带来前所未有的个性化、智能化交互体验。随着这些前沿技术的逐步落地,我们有理由相信,未来的人机交互将更加自然、生动,为人们的生活带来深远的影响。Dopple LAbs的探索,无疑为这一进程树立了标杆,引领着行业向更加广阔的前景进发。原创 2024-08-16 09:00:00 · 49 阅读 · 0 评论 -
《向量数据库指南》——解决方案:采用安全、高性能的Milvus Cloud向量数据库,赋能Dopple AI的创新与发展
面对不断涌现的新模型和技术的快速演变,Sam和他的团队需要付出巨大的努力来保持竞争力。在未来的日子里,随着Dopple AI业务的不断壮大和技术的持续演进,我们有理由相信,Zilliz Cloud将继续发挥其关键作用,为Dopple AI的成功之路提供坚实的支撑。此外,Zilliz Cloud还提供了丰富的API和灵活的数据管理工具,使得Dopple AI的团队能够更加便捷地进行数据操作和应用开发。Zilliz Cloud作为一款全托管的向量数据库服务,不仅提供了出色的性能和安全性,还具备真正的扩展能力。原创 2024-08-15 20:00:00 · 131 阅读 · 0 评论 -
《向量数据库指南》——控制Chatbot对话内容:Dopple AI的创新实践与用户体验优化
为了实现上述的用户交互设计,Dopple AI在后端采用了先进的技术架构。每个对话摘要都会被存储为数据库中的唯一记录,并可以根据用户名进行有效过滤。这一设计确保了用户对话的私密性和可追踪性。对话摘要的生成是一个关键步骤。Dopple AI通过将每三或四条消息合并为一个大的摘要,然后无缝插入到向量数据库中。这一过程不仅实现了对话的高效存储,还为后续的对话记忆和上下文理解提供了基础。向量数据库的应用,使得Dopple AI能够快速检索和匹配相关的对话摘要,从而在对话中带入上下文信息。原创 2024-08-14 20:00:00 · 54 阅读 · 0 评论 -
《向量数据库指南》——用户痛点解析与Dopple AI的创新解决方案:将历史聊天记录融入Chatbot
在当今的AI聊天机器人领域,用户对于交互体验的要求日益提升,他们渴望与聊天机器人进行更加自然、连贯且富有个性化的对话。然而,一个长期存在的用户痛点是将历史聊天记录有效地融入到聊天机器人中,使得机器人能够在对话中具备“记忆”能力,从而提供更加精准和贴切的回应。Dopple AI正是针对这一痛点,通过其创新的技术手段,为用户带来了前所未有的交互体验。原创 2024-08-13 20:00:00 · 62 阅读 · 0 评论 -
《向量数据库指南》——一键部署RAG神器:Milvus Cloud数据智能新纪元
本教程旨在引导您通过一系列步骤,利用Milvus向量数据库、Ray Data分布式计算框架、Amazon S3云存储服务以及Zilliz Cloud全托管向量数据库服务,来设置并优化一个高效的RAG(Retrieval-Augmented Generation)工具。S3提供了高度可扩展的对象存储服务,非常适合存储和检索任意类型的数据,包括向量数据。在将数据导入Milvus之前,您可能需要先将其存储在Amazon S3中,以便于管理和访问。完成注册流程后,您将能够访问AWS管理控制台。原创 2024-08-15 09:00:00 · 59 阅读 · 0 评论 -
《向量数据库指南》——海量数据秒级响应,Milvus Cloud赋能智能检索新时代
综上所述,Milvus Cloud向量数据库以其卓越的扩展性、高效的查询性能以及丰富的企业级特性,在处理大规模、高维度数据方面展现出了强大的竞争力。而基于开源Milvus Cloud构建的Zilliz Cloud全托管向量数据库云服务,则进一步降低了用户的使用门槛和成本,为开发者、数据科学家和企业用户提供了一个高效、便捷、安全的向量数据处理与分析平台。原创 2024-08-14 09:00:00 · 58 阅读 · 0 评论 -
《向量数据库指南》——考虑拓展性
这种可扩展的框架确保了随着数据的增长,您的数据库能力也能随之增长,从而确保整个系统的高效和可靠性能。Milvus 可以通过将整个数据集划分为可管理的 Segment 来应对扩展性的挑战,可以在 Segment 变得不稳定时执行延迟更新或压缩 Segment,从而保持始终出色的搜索质量。为了确保应用能够有效扩展,需要注意的是,由于数据存储在一个大型的 Collection 索引中,这种方式可能导致两个主要问题——索引速度变慢和由于频繁更新数据导致的索引质量下降。这些问题最终会降低搜索质量。原创 2024-08-12 09:00:00 · 457 阅读 · 0 评论 -
《向量数据库指南》——选择、评估并优化索引
访问时间约为 100 毫秒,但对于不常访问的“冷”数据,可能会延长到几秒钟,适用于离线用例和对预算有限的应用。磁盘索引可以管理数十 TB 的数据,延时约为 100 毫秒,适用于较大且对时间敏感度较低的数据集。合适的索引可以优化 RAG 应用的性能,包括查询速度、存储需求和延时。内存索引是一个中间选项,平衡了性能和容量,提供了良好的 QPS,并能够扩展到 TB 级存储,平均延时约为 10 毫秒。通过比较不同索引在这些指标上的性能差异,您可以根据用例和需求做出合适的选择。根据你的具体需求选择合适的索引类型。原创 2024-08-11 20:00:00 · 74 阅读 · 0 评论 -
《向量数据库指南》——RAG应用考虑拓展性
这种可扩展的框架确保了随着数据的增长,您的数据库能力也能随之增长,从而确保整个系统的高效和可靠性能。Milvus Cloud可以通过将整个数据集划分为可管理的 Segment 来应对扩展性的挑战,可以在 Segment 变得不稳定时执行延迟更新或压缩 Segment,从而保持始终出色的搜索质量。为了确保应用能够有效扩展,需要注意的是,由于数据存储在一个大型的 Collection 索引中,这种方式可能导致两个主要问题——索引速度变慢和由于频繁更新数据导致的索引质量下降。这些问题最终会降低搜索质量。原创 2024-08-10 20:00:00 · 64 阅读 · 0 评论 -
《向量数据库指南》——设计一个有效的Schema
在示例中,我们将文档切分为 chunk,并将 Embedding 向量存储在 denseVector 字段中,而在 docID 这个字段中,我们存储了相关的文档信息。Milvus 支持各种索引来管理稠密、稀疏、二进制,甚至是稀疏和稠密混合的 Embedding 向量,从而实现跨各种数据维度的高效搜索,并确保向量数据库应用的最佳性能。Milvus 架构将数据分为几个部分:有固定和动态字段(统称为 payload),一个必需的向量字段,以及类似于传统关系数据库中的时间戳和全局唯一标识符(UUID)等系统字段。原创 2024-08-09 20:00:00 · 54 阅读 · 0 评论 -
《向量数据库指南》——向量搜索:从简单到复杂,生产级部署的挑战与策略
向量搜索,也称为向量相似性搜索或最近邻搜索,是一种常见于 RAG 应用和信息检索系统中的数据检索技术,用于查找与给定查询向量相似或密切相关的数据。一般来说,您只需将数据输入到 Embedding 模型中生成 Embedding 向量,然后将这些向量存储到向量数据库中即可检索到所需的结果。对于数据规模在一千到一万个向量的小型应用而言,这种简单的方法既有效又准确。构建一个可扩展的应用不仅仅要考虑编码,更需要全面考虑各种因素,包括搜索质量、可扩展性、可用性、多租户、成本、安全性等问题!原创 2024-08-08 18:24:13 · 94 阅读 · 0 评论 -
《向量数据库指南》——To B大型知识系统的多租设计
在这个例子中,我们有三个逻辑的 Database,我们假设 Database X 所支撑的知识库很关键,我们不希望 X 受到 Y、Z 的负载干扰。接下来我们再来看看用户层的设计。这个库的背后,一般需要一到多名知识库的维护人员,他们通过分析实际的问答数据对知识库做持续迭代。如果是咱们例子中的这类即时咨询,本质是随机性比较高的搜索,影响结果的核心是知识库质量,而非历史上下文。比如企业内多个独立的业务团队或部门,如果他们都在提供不同的知识库服务,那么对于数据库中台团队,每一个这样的业务团队或部门都是一个租户。原创 2024-08-09 15:00:00 · 49 阅读 · 0 评论 -
《向量数据库指南》——用户数据组织与权限控制:深度解析与多租系统设计
在数字化时代,用户数据的合理组织与高效管理是企业成功的关键要素之一。特别是在处理大规模、高维度的数据时,如向量数据库中的场景,用户数据的组织与权限控制显得尤为重要。本文将以Milvus Cloud Cloud为例,深入探讨用户数据的组织策略与权限控制机制,并进一步扩展到To B(面向企业)和To C(面向消费者)两种典型场景下的多租系统设计。原创 2024-08-08 15:00:00 · 214 阅读 · 0 评论 -
《向量数据库指南》——全球化视野与本土化实践
对很多地方来讲,我觉得我们中国的工程师其实做得很不错的。但是硅谷的工程师不是看的,他们从来没有一天会把市场分成什么国内市场跟国外市场,他们觉得这理所当然的,就是说我把这产品做好以后,我就应该是全球的领先者,全球最大的player,他们甚至在很早期就会在全球去部署他的商业化的团队,从美国到欧洲到亚洲到澳大利亚,但是我们的想法又跟硅谷的很多公司很像,硅谷其实没有“出海”这个概念,大家觉得全球应该适用于一个通用的技术和产品,他们不会说出海什么东西,他们就觉得只要你的产品做得好,全球都应该是你的市场。原创 2024-08-12 09:00:00 · 916 阅读 · 0 评论 -
《向量数据库指南》——开源社区与商业化的平衡
我觉得这个说的特别好,因为开发者工具其实有很多,但是事实上真正去做开源的这种社区的,尤其是做的比较大的,其实这样的企业还是比较少的。在这里我也想替投资人去问的一个问题,过去我们有很长的时间都是针对开源社区的搭建,在我们转向这个商业化过程中,配套的组织形态、人才的搭建和内部的 KPI 以及整个企业的目标制定上有怎么样转化过程?但是我们其实内心很平静,我们非常有自信,我们的自信就在于过去五年我们都在做研发,我们积累了上百个用户场景,有一万多家企业级的客户帮我们去打磨我们产品,这是我们最基本的自信。原创 2024-08-11 09:00:00 · 60 阅读 · 0 评论 -
《向量数据库指南》——向量数据库技术积累与商业机会
我们也在与全球流行的数据处理框架如Fivetran(一个云端的全托管数据集成平台,专注于自动化ELT过程,可以自动处理增量数据复制、调度、负载均衡等任务,简化了数据工程师的工作)、DBT(一个开源的数据转换框架,专注于SQL-based的数据工程,允许数据分析师和工程师使用SQL编写数据转换逻辑,并将这些转换组织成可重用的模型)合作,他们之前提供了许多结构化数据的transformation pipeline,现在也在做非结构化数据的pipeline。我们目前有两个产品,一个是开源产品,一个是云的产品。原创 2024-08-10 09:00:00 · 55 阅读 · 0 评论 -
《向量数据库指南》——企业采用非结构化数据的场景及其深远影响
在过去的一年多里,非结构化数据在企业中的应用已经形成了较为成熟的模式,特别是以RAG(Retrieval Augmented Generation,检索增强生成)为代表的技术框架的兴起,标志着非结构化数据处理能力的一大飞跃。综上所述,非结构化数据在企业中的应用场景日益丰富多样,从最初的文本数据处理到如今的跨模态、多模态处理,再到作为公有数据与私有数据之间的桥梁,RAG技术在这一过程中发挥了至关重要的作用。这种方式既保证了数据的安全性,又充分发挥了AI技术的优势,为企业带来了实实在在的效益。原创 2024-08-09 09:00:00 · 78 阅读 · 0 评论 -
《向量数据库指南》——非结构化数据的行业需求及向量数据库的关键角色
向量数据库通过其独特的存储结构和查询算法,能够实现对非结构化数据的快速检索和高效分析,为AI模型提供强有力的数据支持。Charles指出,非结构化数据,如文本、图像、音频、视频、用户行为日志等,占据了数据总量的绝大多数,据估计约占总数据量的80%以上。随着AI技术的不断成熟,特别是新一代AI大模型的涌现,对非结构化数据的需求达到了前所未有的高度。我们有理由相信,在不久的将来,向量数据库将成为数据领域的新宠儿,为AI技术的广泛应用和社会经济的持续发展贡献重要力量。:在金融行业,非结构化数据的应用尤为广泛。原创 2024-08-08 09:00:00 · 131 阅读 · 0 评论 -
《Milvus Cloud向量数据库指南》——什么是二进制嵌入?
在这篇博客文章中,我们将介绍二进制嵌入的概念,阐述它们的定义特征、优势以及与其他嵌入类型的比较优势。例如,一个稀疏的句子嵌入可能表现为[0, 0, 2.5, 0, 0, -1.2, 0, 0, 0, 3.7, ...],其中大多数维度都是零。例如,“cat”的二进制单词嵌入可以表示为[0, 1, 0, 1, 1, 0, 0, 1, ...],其中每个维度都是二进制的。在本指南中,你已经探索了二进制嵌入的概念,将其与密集和稀疏嵌入进行了对比,并突出了它们在存储效率和计算速度方面的优势。原创 2024-08-03 18:04:22 · 173 阅读 · 0 评论 -
Milvus Cloud架构详解:构建高效、可扩展的向量数据库系统
Milvus Cloud的分布式架构设计充分体现了其在处理大规模向量数据方面的优势。通过接入层、协调服务、执行节点和存储服务的紧密协作,Milvus Cloud不仅实现了高效的数据处理和查询能力,还具备了良好的可扩展性和容错性。随着AI技术的不断发展和应用场景的不断拓展,Milvus Cloud将继续优化其架构设计,提升系统性能,为更多领域的数据处理和分析提供强有力的支持。未来,我们期待Milvus Cloud能够在向量数据库领域发挥更大的作用,推动AI技术的进一步普及和发展。原创 2024-08-06 17:00:00 · 757 阅读 · 0 评论 -
解锁AI新纪元:Milvus Cloud与Zilliz Cloud的高可用之道
在当今数字化时代,系统的持续稳定运行与数据的即时访问性已成为衡量技术服务质量的关键指标。面对复杂多变的运行环境,包括电力波动、网络故障乃至人为操作失误等不可预见因素,数据库系统的高可用性(High Availability, HA)成为了保障业务连续性的重要基石。特别是在大数据与人工智能领域,随着大语言模型(LLM)的兴起,向量数据库作为处理高维数据、支持高效相似性搜索的核心组件,其高可用性的重要性更是被推向了新的高度。原创 2024-08-05 20:00:00 · 365 阅读 · 0 评论 -
Milvus与Zilliz Cloud:向量数据库高可用性的双重飞跃
Milvus Cloud,作为一款专为大规模向量搜索设计的开源数据库,通过其创新的云原生分布式架构,为向量数据库的高可用性提供了强有力的支持。Zilliz Cloud不仅继承了Milvus Cloud的所有优势,还通过一系列创新性的服务和功能,为用户提供了更加便捷、高效、可靠的向量数据存储与检索解决方案。综上所述,Milvus Cloud及其全托管服务Zilliz Cloud通过创新的云原生分布式架构和一系列高级功能的整合,为向量数据库的高可用性提供了强有力的保障。原创 2024-08-04 20:00:00 · 95 阅读 · 0 评论 -
《Milvus Cloud向量数据库指南》——Zilliz Cloud 高可用性深度解析:赋能GenAI应用,引领非结构化数据新纪元
Zilliz Cloud以其卓越的高可用性设计、灵活的资源隔离与多租户支持、全面的数据备份与恢复策略以及透明的系统可用性监控功能,为开发人员构建高效、可靠的GenAI应用提供了坚实的保障。在未来的发展中,Zilliz Cloud将持续优化其高可用性特性,不断提升服务质量和用户体验,为更多企业赋能非结构化数据的智能处理与分析能力,推动AI技术的广泛应用与深度融合。原创 2024-08-04 20:00:00 · 84 阅读 · 0 评论 -
Milvus Cloud向量数据库如何实现高可用
Milvus Cloud-CDC 是一个捕获并实时同步上游 Milvus Cloud Collection 变更并将其下沉到下游 Milvus Cloud 实例的工具。与 Milvus Cloud-backup 结合使用时,Milvus Cloud-CDC 允许用户实施高可用或灾难恢复解决方案。Milvus Cloud 支持内存副本功能。Milvus Cloud 提供了专业的工具,如 Milvus Cloud-backup 和 Milvus Cloud-CDC,以增强数据备份恢复和处理在线增量数据同步。原创 2024-08-03 20:00:00 · 73 阅读 · 0 评论 -
《Milvus Cloud向量数据库指南》——高可用黄金标准:深入解析与业务策略考量
首先,我们需要明确高可用性的基本概念。高可用性是指系统或组件在遭遇故障时,能够迅速恢复服务,减少或避免对用户的影响,从而保持业务运行的连续性和稳定性。它不仅仅关注系统的正常运行时间百分比,更强调在故障发生时的快速响应与恢复能力。高可用性的重要性不言而喻。在数字化转型的浪潮中,企业的核心业务越来越依赖于IT系统的稳定运行。任何一次意外的停机都可能导致数据丢失、订单延误、客户流失等严重后果,进而损害企业的品牌形象和经济效益。因此,追求高可用性,确保系统能够持续提供优质服务,已成为企业IT建设的核心目标之一。原创 2024-08-06 09:00:00 · 179 阅读 · 0 评论 -
《Milvus Cloud向量数据库指南》——高可用vs.容错:深度剖析数据库系统可靠性的双刃剑
高可用与容错作为数据库系统可靠性的两大支柱,各有其独特的优势和应用场景。随着云计算、大数据、人工智能等技术的不断发展,未来数据库系统的可靠性将进一步提升,高可用与容错机制也将更加智能化、自动化。企业可以根据自身的发展需求和技术趋势,灵活选择或组合使用这两种机制,以构建更加稳定、可靠、高效的数据库系统。同时,随着技术的不断进步和成本的逐步降低,容错机制也有望在更广泛的应用场景中得到推广和应用。原创 2024-08-05 09:00:00 · 439 阅读 · 0 评论 -
《Milvus Cloud向量数据库指南》——什么是高可用:深入理解数据库系统中的高可用性架构
高可用性的概念不仅仅局限于减少停机时间,它还包括了系统在面对各种挑战时能够快速恢复服务的能力。在数据库系统中,这意味着即使面临硬件故障、网络中断或软件崩溃等突发情况,系统依然能够保持数据的完整性和服务的连续性,确保用户访问不受影响或影响最小化。高可用性之所以重要,是因为它直接关系到企业的业务连续性、客户满意度以及市场竞争力。在高度竞争的市场环境中,任何一次长时间的服务中断都可能导致客户流失、品牌信誉受损,甚至造成巨大的经济损失。因此,构建高可用的数据库系统已成为现代企业IT战略规划中的关键环节。原创 2024-08-04 09:00:00 · 120 阅读 · 0 评论 -
《Milvus Cloud向量数据库指南》——Milvus 向量数据库:解锁向量相似性搜索的无限潜力
在数据驱动的时代,相似性搜索已成为众多行业不可或缺的一部分,尤其是在推荐系统、图像识别、自然语言处理等领域。然而,尽管搭建一个基本的相似性搜索应用看似简单,但将其推向生产环境并维持高效稳定运行,却是一项复杂且充满挑战的任务。这主要是因为向量数据与传统关系型数据库中的结构化数据存在本质区别,其高维、稀疏、动态变化的特性要求更为专业的存储与检索机制。在这样的背景下,Milvus 向量数据库以其独特的优势脱颖而出,成为解决向量数据管理难题的理想选择。原创 2024-08-02 20:00:00 · 50 阅读 · 0 评论 -
《Milvus Cloud向量数据库指南》——多模态融合新纪元:音频、视频与文本的无缝转换
多模态文本、音频、视频数据的融合与应用,是人工智能技术发展的重要方向之一。通过构建多模态RAG系统,我们不仅能够实现跨模态的信息转换与检索,还能在此基础上创造出更加丰富、生动、多样的多媒体内容。OpenAI的Whisper、TTS模型以及Sora系统等前沿技术,正是这一趋势下的杰出代表,它们不仅推动了技术的进步,更为未来的智能生活描绘了美好的蓝图。随着技术的不断成熟和完善,我们有理由相信,多模态数据处理与应用将会在更多领域展现出其独特的魅力和无限的可能。原创 2024-08-01 20:00:00 · 71 阅读 · 0 评论 -
《Milvus Cloud向量数据库指南》——多模态图像与文本数据:探索SigLIP与Unum的无限可能
多模态Embedding模型作为人工智能领域的一项重要技术,正在逐步改变我们处理和理解数据的方式。从CLIP到SigLIP,再到Unum,我们看到了多模态Embedding技术不断发展和完善的历程。未来,随着技术的不断进步和应用场景的不断拓展,我们有理由相信,多模态Embedding模型将会在更多领域发挥重要作用,为人工智能技术的发展注入新的活力。同时,我们也期待更多的研究者和开发者能够加入到这一领域中来,共同推动多模态Embedding技术的创新和发展。原创 2024-08-03 09:00:00 · 68 阅读 · 0 评论 -
《Milvus Cloud向量数据库指南》——音频数据如何选择合适的 Embedding 模型?
与图像搜索领域的“以图搜图”相类似,音频搜索技术也逐步成熟,允许用户基于输入的音频片段快速定位到相似或相关的音频内容。这一技术的实现,离不开强大的音频处理模型和算法的支持,其中,预训练音频神经网络(PANNs, Pre-trained Audio Neural Networks)以其卓越的性能和广泛的应用前景,成为了音频搜索领域的一颗璀璨明星。通过在大规模数据集上的训练,PANNs不仅学会了如何区分不同类型的音频,还学会了如何捕捉音频中的细微差别和上下文信息,这对于提高音频搜索的准确性和效率至关重要。原创 2024-08-02 09:00:00 · 67 阅读 · 0 评论 -
《Milvus Cloud向量数据库指南》——图像数据:ResNet50与图像及视频搜索的深度解析
ResNet,全称Residual Network(残差网络),由微软研究院的何恺明等人在2015年提出,并迅速成为计算机视觉领域的一项重大突破。ResNet的核心思想在于引入了残差学习(Residual Learning)的概念,通过构建残差块(Residual Blocks)来解决深度神经网络训练中的梯度消失或梯度爆炸问题,从而允许网络达到前所未有的深度,同时保持良好的训练效率和泛化能力。ResNet50,即包含50层卷积层的残差网络,是该系列中较为经典且广泛使用的一个版本。原创 2024-08-01 09:00:00 · 66 阅读 · 0 评论 -
Milvus Cloud实战指南:选型与部署的艺术
在向量数据库的应用过程中,选择合适的解决方案和部署形态是成功的关键。通过“Milvus Cloud 向量数据库进阶”系列文章的介绍,我们希望能够帮助开发者们更好地理解不同部署形态的特点和适用场景,从而在实战中少走弯路。无论是初入AI领域的开发者还是经验丰富的专家,都能从这一系列文章中找到有价值的参考和建议。让我们携手共进,在向量数据库的广阔天地中探索无限可能!原创 2024-07-30 17:00:00 · 72 阅读 · 0 评论 -
《Milvus Cloud向量数据库指南》——不同开源向量数据库的适用数据规模及其技术特点深度剖析
在探讨向量数据库领域时,我们不得不提及多个备受瞩目的开源项目,它们各自以其独特的技术优势和适用场景赢得了广泛的关注。本文将深入剖析Milvus Cloud、Chroma、Weaviate、以及Qdrant这几个开源向量数据库在不同数据规模下的应用表现,以及它们各自的技术特点和优势。原创 2024-07-29 17:00:00 · 174 阅读 · 0 评论 -
Milvus Lite, Milvus Cloud, Standalone, 与 Distributed:组件功能关系深度解析
在大数据时代,高效、灵活的向量搜索解决方案成为了许多企业和研究机构不可或缺的技术支撑。Milvus,作为一款开源的向量数据库,凭借其卓越的性能、可扩展性和易用性,在众多向量搜索引擎中脱颖而出。Milvus 提供了 Lite、Cloud、Standalone、Distributed 四种部署模式,每种模式都针对特定的使用场景进行了优化,但它们之间并非孤立存在,而是通过共享底层组件实现了功能的一致性和演进速度的同步。本文将深入剖析这四种部署模式的组件功能关系,以及它们如何共同支撑起 Milvus 的强大能力。原创 2024-07-28 17:00:00 · 75 阅读 · 0 评论 -
《Milvus Cloud向量数据库指南》——Milvus Cloud不同场景下的部署形态选型
注意这里 Milvus Lite 和 Milvus Standalone 并不是独立的两部分,它们支持了一个简单的从笔记本到服务器的工作流:由于 Milvus Lite、Standalone、Distributed 共享一套客户端接口,同样的业务侧代码既可以使用本地数据进行原型开发,也可以链接到服务端进行大规模数据验证。需要注意的是,尽管 Milvus 官方提供了一系列专用运维工具,以及尽可能丰富的生态工具对接,运维一套大型分布式系统并非容事,在这期间你可能会需要比较多的社区帮助。原创 2024-07-27 17:00:00 · 69 阅读 · 0 评论 -
《Milvus Cloud向量数据库指南》——Gecko+VectorDB+Gemini构建多模态RAG应用
在深入探讨如何利用Gecko、VectorDB、Gemini等先进技术构建多模态RAG(Retrieval-Augmented Generation)应用的过程中,我们首先需要从理论层面出发,理解RAG模型的核心价值与潜在应用场景,再逐步深入到技术实现的细枝末节,最终展现这一领域在Google Cloud AI/ML解决方案框架下的完整图景。原创 2024-07-29 18:00:00 · 863 阅读 · 0 评论 -
《Milvus Cloud向量数据库指南》——ChatGLM:从GLM-130B到GLM-4
在人工智能的浩瀚星空中,智谱AI如同一颗璀璨的新星,以其独特的技术视角和坚定的创新步伐,在通用人工智能(AGI)的征途上留下了深刻的足迹。技术生态总监贾伟在近期的一次分享中,不仅为我们描绘了智谱AI在AGI道路上的宏伟蓝图,还深入剖析了从GLM-130B这一巨型模型到更为精细、高效的GLM-4系列模型的演进历程,展现了公司在模型优化、应用场景拓展以及技术生态构建方面的卓越成就。原创 2024-07-28 20:00:00 · 210 阅读 · 0 评论