新入驻CSDN博客,所学整理在此,方便交流
工作的主要内容:
- Hadoop平台使用时候的常见问题
- Hadoop/Spark 编程,数据处理。包括GraphX、Spark Streaming
- Hive、Hbase数据库操作
- Impala、Elastic Search数据聚合和索引处理
- 针对大数据分析的ML算法设计
- 数据可视化
- 数据输出端口http API、文件夹API
- Python、Java、Scala编程
- 其他大数据组件学习心得、例如sqoop、oozie、yarn、zookeeper等
工作的主要内容: