- 博客(3)
- 资源 (11)
- 收藏
- 关注
原创 解决spark-redshift只能写不能读的问题
spark-redshift 是由 databricks 公司开发的读写redshift 工具包 在AWS 中国区总出现问题,比如读redshift 报错如下Exception in thread "main" com.amazonaws.services.s3.model.AmazonS3Exception: Access Denied (Service: Amazon S3; Status
2017-08-31 16:02:54 1133 2
原创 spark 写 ElasticSearch 提升性能解决方案
ES 官网提供了一套Spark写ES接口 参见 : https://www.elastic.co/guide/en/elasticsearch/hadoop/current/spark.html在工作实践中使用 Spark Streaming 写 ES 发现性能太差了,经研究发现,这套接口基于es底层http的restful接口而实现, 我另辟蹊径,采用TCP通信方式,写ES,性能获得了极大提
2017-08-30 10:18:18 6466 8
原创 通过maven-shade-plugin 解决Elasticsearch与spark的jar包冲突问题
项目需求,通过spark写入ES,用官方自带的restful 接口,存在性能问题,改用TCP方式写入,但是遇到和spark环境jar冲突,冲突为guava jar包。刚开始通过修改spark 环境变量使得 guava jar版本包统一,但是只能运行spark local 模式下。后来采用网上技术文章maven-shade-plugin,才得以彻底解决。网上有很多现成的maven-shade-plu
2017-08-29 16:27:04 1046
Spring Boot in Action
2017-11-23
从PAXOS到ZOOKEEPER 国人写的技术实践书 分布式
2017-09-22
机器学习实战 英文版 Machine Learning in Action 书中所有代码和数据集
2017-09-13
机器学习实战 英文版 Machine Learning in Action
2017-09-13
数据库实现英文第二版 Database System Implementation
2017-09-11
yammer metrics-2.2.0 源码
2017-09-06
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人