![](https://img-blog.csdnimg.cn/20190918140129601.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
大数据
大数据
the uzi
这个作者很懒,什么都没留下…
展开
-
数据使能实施全景图
数据原创 2023-03-06 10:06:16 · 23 阅读 · 0 评论 -
odps sql
odps原创 2023-02-15 11:16:46 · 156 阅读 · 0 评论 -
Hadoop(HDFS)
随着数据量越来越大,在一个操作系统存不下所有的数据,那么就分配到更多的操作系统。的使用场景:适合一次写入,多次读出的场景,且不支持文件的修改。它通过增加副本的形式,提高容错性。(1)一个文件只能有一个写,不允许多个线程同时写;(2)小文件存储的寻址时间会超过读取时间,它违反了。(2)某一个副本丢失以后,它可以自动恢复。管理的磁盘中,但是不方便管理和维护,迫切。,比如毫秒级的存储数据,是做不到的。无法高效的对大量小文件进行存储。,通过多副本机制,提高可靠性。)存储大量小文件的话,它会占用。原创 2023-02-15 10:07:41 · 60 阅读 · 0 评论 -
hadoop+hive+sqoop+spark单机版搭建
【代码】hadoop+hive+sqoop+spark单机版搭建。转载 2023-02-15 09:31:22 · 475 阅读 · 1 评论