python3 与主流大数据组件

大数据领域主要是以java为主,次要的编程语言为python,scala等,本文介绍和python相关的大数据:

python所需要的版本为python3.6:

数据源:
MySQL:
oracle:
MS SQL server:
postgresql: pip install  psycopg2
MongoDB:
Neo4J:
Redis:

大数据处理:
Hadoop:(HDFS、MapReduce、YARN)
 pip install dask
 pip install mrjob
 pip install pydoop (默认的为pydoop 1.2不稳定)
# pip install --pre pydoop
 hive:
 pyhive impyla
 hbase:
 happybase
 
 presto:
 pip install presto
 pip install presto-python-client
 clickhouse:
 ElasticSearch:
 elasticsearch-py
 pip install elasticsearch
 pip install pysolr
 pip install elasticsearch-dsl
 kafka:
 pip install kafka-python
 kafka pykafka
 spark:
 flink:
 
 kylin:
 kylinpy
 
 kudu:
 kudu-python
 impala:
 impyla
 apache-beam
 大数据可视化:
 pyecharts
 hue
 superset
 调度系统:
 luigi
 airflow
 安全:


Druid.io:官方
pip install pydruid
网站:
https://github.com/druid-io/pydruid
注意:
若同时安装上述软件,其依赖的软件包会有冲突。建议独立部署.

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值