spark2.0的SparkSQLbug

最新推荐文章于 2021-02-07 21:01:47 发布

chenlong5197

最新推荐文章于 2021-02-07 21:01:47 发布

阅读量69

点赞数

原文链接：https://my.oschina.net/itjoin/blog/810736

版权

Spark2.0虽然速度很快，但是SparkSQL很多bug，没法采用SparkSession把数据从MySQL中导入和获取数据，采用Spark shell可以进入，执行spark.read.format("jdbc").options(Map("url" ->"jdbc:mysql://192.168.10.41:3306","user","root","password" -> "123456","Driver":"com.jdbc.mysql.Driver")).load(),一开始会出现报错，错误信息一般是：AlreadyExistsException，但是第二次运行同样的语句又是ok的，还有spark这样导入数据时，可以show(),但是不能write.saveAsTable(“table”);没法真正的保存数据进入。目前发现Spark2.0很不稳定，很多明显的bug，建议大家还是先使用Spark1.6.2版本

以下是本人录制的一套spark1.6.2的实时流机器学习视频：

1、spark与kafka的介绍
2、spark的集群安装
3、Spark RDD函数讲解与实战分析
4、Spark 的Java操作实现简单程序
5、SparkRDD原理详细剖析播放
6、Spark 机器学习，API阅读
7、Kafka架构介绍以及集群安装
8、Kafka生产者Producer的实战
9、Kafka消费者Consumer剖析与实战
10、Kafka复杂消费者的详细讲解
11、Kafka数据安全，以及Spark Kafka Streaming API
12、Spark+Kafka+Mysql整合
13、Spark 机器学习ALS设计
14、Spark ALS协同过滤java实战
15、Spark ALS给用户推荐产品
16、Spark机器学习后存储到Mysql
17、Spark读取Kafka流构建Als模型
18、Spark处理Kafka流构建Als模型
19、Spark处理Kafka流实现实时推荐算法
20、Spark学习经验总结，spark2与spark1的区别，下期预告

大象在线分享spark+kafka实时流机器学习实战视频，由夜行侠老师精心录制
http://www.itjoin.org/course/detail/57aa8938b52a8f0ddbd81763