![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据技术
文章平均质量分 79
大数据技术,ES,clickhouse,Hadoop,spark,flink
ThinkPet
青年码农一枚
展开
-
Typesense-开源的轻量级搜索引擎
Typesense是一个快速、允许输入错误的搜索引擎,用于构建愉快的搜索体验。开源的Algolia替代方案& 易于使用的弹性搜索替代方案官网: https://typesense.org/目前已有18.4k star。原创 2024-06-07 10:06:01 · 658 阅读 · 0 评论 -
MeiliSearch-轻量级且美丽的搜索引擎
MeiliSearch 是一个功能强大、快速、开源、易于使用和部署的搜索引擎。MeiliSearch 适用于各种需要搜索功能的场景,例如网站搜索、文档搜索、电商搜索等。它可以与各种编程语言和框架集成,提供灵活的搜索解决方案。官网 https://www.meilisearch.com/目前已有44k star。原创 2024-06-07 11:18:28 · 1560 阅读 · 1 评论 -
详解ES分片
分片可以理解为是将一个大型索引拆分成多个较小部分的机制。ES中所有数据会均衡的存储在集群中各个节点的分片中。分片是一种存储形式概念,并非物理隔离。原创 2024-06-06 14:34:29 · 1152 阅读 · 0 评论 -
Hbase学习笔记
HBase是一个高可靠、高性能、面向列、可伸缩的分布式存储系统。它利用Hadoop HDFS作为其文件存储系统,并提供实时的读写的数据库系统。HBase的设计思想来源于Google的BigTable论文,是Apache的Hadoop项目的子项目。它适合于存储大表数据,并可以达到实时级别。HBase不同于一般的关系数据库,它基于列而不是基于行的模式,并且主要用来存储非结构化和半结构化的松散数据。HBase的扩展性主要体现在两个方面:一是基于运算能力(RegionServer)的扩展,通过增加RegionSer原创 2024-04-24 17:20:22 · 1161 阅读 · 0 评论 -
大数据-数据内容分类
结构化数据:可以使用关系型数据库表示和存储,可以用二维表来逻辑表达实现的数据结构化数据:二维表(关系型)结构化数据:先有结构、再有数据数据以行为单位,一行数据表示一个实体的信息,每一行数据的属性是相同的,存储在数据库中如mysql数据库中的数据、csv文件能够用数据或统一的结构加以表示,如数字、符号能够用二维表结构来逻辑表达实现,包含属性和元组,如:成绩单就是属性,90分就是其对应的元组结构化的数据的存储和排列是很有规律的,这对查询和修改等操作很有帮助针对结构化数据存在成熟的分析工具。原创 2023-08-05 16:34:07 · 967 阅读 · 0 评论