大数据
文章平均质量分 82
数新智能
数新智能,全称浙江数新网络有限公司,2020年7月成立,总部位于杭州,在上海、北京、深圳等各地设有分支机构。
公司创始人陈廷梁(花名:王贲)是原阿里云大数据平台研发总监,阿里云产品委员会与架构组成员,主导御膳房/数加平台/DataWorks云数仓、云数据平台等核心平台的产品研发与商业化。
数新智能是一家专注于一站式多云数据智能平台和数据价值流通的服务商,可提供一站式大数据+AI基础服务,让大数据、AI和数据价值安全流通得到高质量结合,助力客户实现数字化、智能化转型,激活数据要素潜能,致力于让每个人享受数据的价值。
展开
-
hive数据迁移
Distcp是hadoop内部自带的一个程序,用于hdfs之间的数据拷贝。Distcp是作为一个MapReduce作业来实现的,该复制作业是通过集群中并行运行的map来完成。每个文件通过一个map进行复制,并且distcp试图为每一个map分配大致相等的数据来执行,即把文件划分为大致相等的块。默认情况下,每个集群节点最多分配20个map任务。原创 2023-06-29 15:08:23 · 494 阅读 · 0 评论 -
拉链表的原理及简单实现
拉链表是针对数据仓库设计中表存储数据的方式而定义的,顾名思义,所谓拉链,就是记录历史。记录一个事物从开始,一直到当前状态的所有变化的信息。原创 2023-06-29 14:56:43 · 395 阅读 · 0 评论 -
大数据基础知识
大数据基础知识原创 2023-04-17 10:41:52 · 428 阅读 · 0 评论