商业智能-数据分析
db_guy
前行亦是归途
展开
-
Python数据科学家常用package
包名 功能 Numpy N维数组,线性代数,傅里叶变换,和随机数的能力 SciPy SciPy是世界上著名的Python开源科学计算库,建立在Numpy之上。它增加的功能包括数值积分、最优化、统计和一些专用函数。 pandas pandas是基于 Numpy 构建的,让以 Numpy 为中心的应用变得更加简单 Matplotlib Matplotlib 是 Pyth原创 2017-09-15 10:18:19 · 495 阅读 · 0 评论 -
hive导入CSV数据,使用动态分区重新分区
创建数据表hive> create database cus; hive> use cus; hive> create table telno_md5( > phone string, > md5 string ) > ROW FORMAT DELIMITED > FIELDS TERMINATED BY ',' > STORED AS TEXTFILE;导原创 2017-12-07 15:38:08 · 1526 阅读 · 0 评论