【Pyspark】list转为dataframe报错：TypeError:not supported type: class numpy.float64

最新推荐文章于 2024-04-21 13:46:03 发布

J小白Y

最新推荐文章于 2024-04-21 13:46:03 发布

阅读量4.2k

点赞数

分类专栏： Python小白的进阶之路文章标签： python spark

本文链接：https://blog.csdn.net/Jarry_cm/article/details/106720194

版权

Python小白的进阶之路专栏收录该内容

54 篇文章 19 订阅

订阅专栏

在PySpark中经常会使用到dataframe数据形式，本篇博文主要介绍，将list转为dataframe时，遇到的数据类型问题。

有如下一个list：

[(22.31670676205784, 15.00427254361571, 14.274554462639939, -48.011495169271186)]

正常情况下：

#!/usr/bin/python
# -*- coding: utf-8 -*-
from pyspark.sql import Row
from pyspark.ml.linalg import Vectors
import numpy as np
from pyspark.ml.classification import LogisticRegression
from pyspark.sql import SparkSession
from pyspark.sql import SQLContext
import os
from pyspark import SparkContext, SparkConf
from pyspark.sql import HiveContext
from pyspark.mllib.classification import LogisticRegressionWithLBFGS



spark = SparkSession \
    .builder \
    .master("yarn") \
    .appName('create_df_test2') \
    .enableHiveSupport() \
    .getOrCreate()


re = [(22.31670676205784, 15.00427254361571, 14.274554462639939, -48.011495169271186)]
print(re)
print(type(re))

df_re = spark.createDataFrame(re,['r1', 'r2', 'r3', 'r'])

由于re中的数据，其实都是float类型的，直接这样写会报错，如下：

这时需要这样处理：

spark = SparkSession \
    .builder \
    .master("yarn") \
    .appName('create_df_test2') \
    .enableHiveSupport() \
    .getOrCreate()


re = [(22.31670676205784, 15.00427254361571, 14.274554462639939, -48.011495169271186)]
print(re)
print(type(re))

df_re = spark.createDataFrame([(float(tup[0]), float(tup[1]), float(tup[2]), float(tup[3])) for tup in re],
                              ['r1', 'r2', 'r3', 'r'])

这样就可以达到效果了。

J小白Y

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【Pyspark】list转为dataframe报错：TypeError:not supported type: class numpy.float64

在PySpark中经常会使用到dataframe数据形式，本篇博文主要介绍，将list转为dataframe时，遇到的数据类型问题。有如下一个list：[(22.31670676205784, 15.00427254361571, 14.274554462639939, -48.011495169271186)]正常情况下：#!/usr/bin/python# -*- coding: utf-8 -*-from pyspark.sql import Rowfrom ...
复制链接

扫一扫