- 博客(5)
- 收藏
- 关注
原创 数据仓库Hive编程——数据类型和文件格式(四):读时模式
当用户向传统数据库中写入数据的时候,不管是采用装载外部数据的方式,还是采用将一个查询的输出结果写入的方式,或者是使用UPDATE语句等等,数据库对于存储都具有完全的控制力。数据库就是“守门人”。传统数据库是写时模式(schema on write),即数据在写入数据库时对模式进行检查。Hive对底层存储并没有这样的控制。对于Hive要查询的数据,有很多种方式对其进行创建、修改,甚至损坏。因此,H...
2019-07-31 20:28:48 13080
原创 数据仓库Hive编程——数据类型和文件格式(三):文本文件数据编码
分类目录:商业智能《数据仓库Hive编程》总目录下面我们一起来研究文件格式,首先举个最简单的例子,也就是文本格式文件。毫无疑问,用户应该很熟悉以逗号或者制表符分割的文本文件,也就是所谓的逗号分隔值(CSV)或者制表符分割值(TSV)。只要用户需要,Hive是支持这些文件格式的,在后面的文章将会介绍其具体使用方式。然而,这两种文件格式有一个共同的缺点,那就是用户需要对文本文件中那些不需要作为分隔符...
2019-07-31 20:11:23 12781 1
原创 数据仓库Hive编程——数据类型和文件格式(二):集合数据类型
分类目录:商业智能《数据仓库Hive编程》总目录相关文章:数据类型和文件格式(一):基本数据类型数据类型和文件格式(二):集合数据类型数据类型和文件格式(三):文本文件数据编码数据类型和文件格式(四):读时模式Hive中的列支持使用struct,map和array集合数据类型。需要注意的是下表中语法示例实际上调用的是内置函数。数据类型描述字面语法示例STRUCT...
2019-07-31 20:08:33 12182 1
原创 数据仓库Hive编程——数据类型和文件格式(一):基本数据类型
分类目录:商业智能《数据仓库Hive编程》总目录Hive支持关系型数据库中的大多数基本数据类型,同时也支持关系型数据库中很少出现的3种集合数据类型,其中一个需要考虑的因素就是这些数据类型是如何在文本文件中进行表示的,同时还要考虑文本存储中为了解决各种性能问题以及其他问题有哪些替代方案。和大多数的数据库相比,Hive具有一个独特的功能,那就是其对于数据在文件中的编码方式具有非常大的灵活性。大多数...
2019-07-31 19:49:36 12828 1
原创 数据仓库Hive编程——Hive基础知识
从早期的互联网主流大爆发开始,主要的搜索引擎公司和电子商务公司就一直在和不断增长的数据进行较量。最近,社交网站也遇到了同样的问题。如今,许多组织已经意识到他们所收集的数据是让他们了解他们的用户,提高业务在市场上的表现以及提高基础架构效率的一个宝贵的资源。Hadoop生态系统就是为处理如此大数据集而产生的一个合乎成本效益的解决方案。Hadoop实现了一个特别的计算模型,也就是MapReduce,其...
2019-07-29 19:20:30 21524 4
思维导图源文件《预训练模型总览》
2023-06-27
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人