ZILLIZ

Reinvent Data Science

原创 Milvus带你实现轻松搭建以图搜图系统

当您听到“以图搜图”时,是否首先想到了百度、Google 等搜索引擎的以图搜图功能呢?事实上,您完全可以搭建一个属于自己的以图搜图系统:自己建立图片库;自己选择一张图片到库中进行搜索,并...

2020-02-15 18:42:13

阅读数 1505

评论数 0

原创 Chat with Milvus (1) 问答实录 - 近似搜索、分布式、数据库, 来看看我们都聊了些什么!...

本周二我们在线上与 Milvus 的朋友们进行了一场精彩的问答。我们也为不能参加的朋友们做了一个完整的文字实录。觉得字数多看起来很累的朋友们可以根据自己想了解的内容观看影片回放。也想加入...

2020-02-28 10:42:51

阅读数 0

评论数 0

原创 Milvus 最佳实践之如何设置API参数 (3)

在上文《Milvus 最佳实践之如何设置系统配置项 (2)》中,针对Milvus 0.6.0版本的关键系统配置项给予了详细说明。本文针对Milvus 0.6.0版本的API...

2020-02-26 10:33:23

阅读数 21

评论数 0

原创 Milvus 社区周报- Week 8, 2020

测试目标WAL 功能测试已经通过,稳定性测试和性能测试进行中向量删除/Flush/GetVectorByID/GetTableInfo/Compact,功能测试/稳定性测试/性能测试中H...

2020-02-25 12:51:16

阅读数 19

评论数 0

原创 Milvus 最佳实践之如何设置系统配置项 (2)

Milvus 最佳实践之如何选择索引类型 在上文《Milvus 最佳实践之如何选择索...

2020-02-19 14:16:25

阅读数 31

评论数 0

原创 Milvus实战 | 基于Mishards的分布式集群方案

​Milvus 作为一款针对海量特征向量的相似性搜索引擎,在单台服务器上就可以处理十亿级数据规模。而对于百亿或者千亿级数据,则需要具有水平扩展能力的 Milvus 集群来满足对海量向量数据的高性能检索需求。 Mishards 是一个用 Python 开发的 Milvus 集群中间件。使用 Mis...

2020-02-17 10:57:16

阅读数 68

评论数 0

原创 AI 加速新药研发- 化合物虚拟筛选的实现

​面对类似 2019-nCOV(新型冠状病毒)这样快速传播的疾病, AI 如何能帮助药物专家加速新药研发、降低疫情的影响?这裡我们以 Milvus 为例,希望能为药物发现的问题,提供一个解决的工具。 药物发现 (Drug discovery) 是新药创新的源头,在新药研发中具有举足轻重的地位。药...

2020-02-17 10:49:23

阅读数 84

评论数 0

原创 Milvus 实战 | 基于分区表实现结构化数据与非结构化数据的混合查询

通过深度学习的神经网络模型,可以将图片、视频、语音、还有文本等非结构化数据转换为特征向量。除了结构化的向量,这些数据往往也需添加其他属性。如人脸图片,可以添加性别、是否戴眼镜、图片抓取时...

2020-02-07 09:00:00

阅读数 87

评论数 0

原创 Milvus 揭秘| 向量索引算法HNSW和NSG的比较

随着机器学习、深度神经网络的不断发展,数据的向量化无处不在。而针对海量向量数据的搜索,无论是工业界还是学术界都做了大量的研究。本文主要讲解两个基于近邻图的向量搜索算法,并比较其适用场景。...

2020-01-16 09:26:30

阅读数 158

评论数 0

原创 开源| 用PaddlePaddle & Milvus 轻松搭建个性化推荐系统

背景介绍在网络技术不断发展和电子商务规模不断扩大的背景下,商品数量和种类快速增长,用户需要花费大量时间才能找到自己想买的商品,这就产生了信息过载问题。为了解决这个问题,个性化推荐系统(R...

2019-12-27 09:41:25

阅读数 208

评论数 0

原创 Milvus实战 | 基于Keepalived的高可用方案

Milvus 与 KeepalivedMilvus 作为一款性能领先、易学易用的向量搜索引擎,项目开源以来受到广泛关注,数百名开发者加入了 Milvus 社区开始测试、使用,贡献文档、代...

2019-12-19 09:00:00

阅读数 103

评论数 0

原创 Milvus v0.6.0 新功能介绍

**版本兼容**| Milvus 版本 | pymilvus 版本 | Java SDK 版本 || ----------- | ------------- | ------------...

2019-12-10 15:49:41

阅读数 230

评论数 5

原创 Milvus 最佳实践之如何选择索引类型

在Milvus 0.5.3版本中,支持的索引类型包括如下几种:FLATIVFFLATIVFSQ8IVFSQ8H在不同的应用场景下该如何选择一种合适的索引并非那么地显而易见,需要在资源使用...

2019-12-09 11:07:07

阅读数 148

评论数 0

原创 Milvus 0.6.0新增功能:分区表

一、什么是分区?经常使用数据库的人应该都了解,随着单张表的数据量不断增长,查询性能也会不断下降。单张表的数据变得很臃肿的时候,就要考虑将这张表拆分。第一种做法是手工分表,比如某条经常使用...

2019-11-29 09:00:00

阅读数 150

评论数 8

原创 Milvus在云从的深度实践

Milvus作为一个开源的分布式向量搜索引擎,凭借其出色的产品设计和工程实现,已被多家不同行业的科技公司融合进各种行业解决方案中。云从科技,作为世界领先的AI科技独角兽公...

2019-11-27 09:00:00

阅读数 199

评论数 0

原创 Milvus中ivfsq8索引测试报告

本文描述了ivfsq8索引在Milvus单机部署方式下的测试结果。测试目标参数不同情况下的查询时间和召回率。测试方法????软硬件环境操作系统:CentOS Linux rel...

2019-11-20 09:00:00

阅读数 111

评论数 0

原创 大规模向量检索场景下的数据管理(下篇)

错过上篇的同学可以点击标题回顾三、Milvus 是什么?Milvus 是 一款开源的、针对海量特征向量的相似性搜索引擎。Milvus能够很好地应对海量向量数据,它集成了目...

2019-11-19 09:00:00

阅读数 181

评论数 0

原创 Milvus v0.5.3 版本发布说明

开源向量相似度搜索引擎 Milvus 自开源以来获得开发者们的高度关注,不少开发者给我们提了很多宝贵意见和建议,在此 0.5.3 版本更新之际,欢迎大家给 Milvus ...

2019-11-15 09:00:00

阅读数 100

评论数 0

原创 ZILLIZ携手NVIDIA,参展2019中国移动全球合作伙伴大会

随着5G商用牌照的发放,5G网络的快速部署,5G多款商用终端的不断推出,未来已来,5G就在眼前!为迎接5G时代的到来,继成功举办6届全球合作伙伴大会之后,中国移动通信集团...

2019-11-12 18:00:00

阅读数 71

评论数 0

原创 我们把全球领先的向量搜索引擎 Milvus 开源了

Milvus 高性能向量搜索引擎已经开源了。GitHub Repo:https://github.com/milvus-io/milvus(或点击阅读原文查看)。Mil...

2019-11-05 10:13:33

阅读数 770

评论数 0

原创 海量向量搜索引擎 Milvus 开源啦

之前已经向大家介绍过 Milvus 强大的向量近似度搜索功能,包括单机实现十亿向量(SIFT1B)可以做到 1:N 在 400ms 内返回(召回率90%)。 为了邀请更多感兴趣的小伙伴加入到向量搜索的领域,加速实现更多 AI 应用的落地,我们决定将 Milvus 开源,就在今天! 无论您是技术大佬...

2019-10-15 20:29:46

阅读数 708

评论数 0

原创 基于 Milvus 实现向量与结构化数据混合查询

一、概述 通过深度学习的神经网络模型,可以将图片、视频、语音、还有文本等非结构化数据转换为特征向量。除了结构化的向量,这些数据往往也需添加其他属性。如人脸图片,可以添加性别、是否戴眼镜、图片抓取时间等标签;文本可以添加语言类型、语料分类、文本创建时间等标签。 以往,人们通常将特征向量存入结构化的标...

2019-08-29 14:00:03

阅读数 418

评论数 0

原创 如何玩转十亿向量检索(SIFT1B)

如何玩转十亿向量检索(SIFT1B)开始之前十亿向量检索ANN_SIFT1B 数据集数据预处理与数据导入①数据预处理②数据导入数据检索①准确率查询②性能查询总结 开始之前 请阅读以下文章,以了解 Milvus 的基本操作原理: Milvus 快速上手 小试身手:百万向量搜索 这次需要用到的服...

2019-08-26 18:46:29

阅读数 1364

评论数 0

原创 小试牛刀:百万向量搜索(SIFT1B)

包教包会:笔记本上练习百万向量搜索

2019-08-26 18:29:30

阅读数 847

评论数 10

原创 Datafication :挖掘非结构信息的数据价值

Datafication :挖掘非结构信息的数据价值 数据量的指数级增长时代已经来临。据 IDC 统计,2025 年全球的数据总量将达到 175 ZB 。而其中超过 90% 的新增数据为非结构化数据(网络日志、图片、视频、音频等)。如何充分挖掘海量非结构信息中的价值,从而构建竞争优势,已经成为企业...

2019-08-26 18:12:13

阅读数 187

评论数 0

提示
确定要删除当前文章?
取消 删除