- 博客(1)
- 资源 (5)
- 问答 (2)
- 收藏
- 关注
原创 Spark SQL介绍和DataFrame概念以及其API的应用示范
Spark SQL介绍: Spark SOL是用于结构化数据、半结构化数据处理的Spark高级模块,可用于从各种结构化数据源,例如JISON (半结构化) 文件、CSV文件、ORC文件(ORC文件格式是一种Hive的文件存储格式,可以提高Hive表的读、写以及处理数据的性能)、 Hive表、Parquest文件(新型列式存储格式,具有降低查询成本、高效压缩等优点,广泛用于大数据存储、分析领域...
2020-08-16 12:41:12 6318
Python可变对象与不可变对象
Python里和None比较时,为什么是 is None 而不是 == None 呢?
这是因为None在Python里是个单例对象,一个变量如果是None,它一定和None指向同一个内存地址。而 == None背后调用的是__eq__,而__eq__可以被重载
2018-09-03
hadoop运行气象数据案例,最终结果时map输出结果
2018-07-14
hadoop集群启动后网页上看不到datanode节点信息
2018-05-15
TA创建的收藏夹 TA关注的收藏夹
TA关注的人