Pyspark特征工程--ElementwiseProduct

最新推荐文章于 2023-07-12 11:22:56 发布

Gadaite

最新推荐文章于 2023-07-12 11:22:56 发布

阅读量402

点赞数

文章标签： spark 大数据数据挖掘

本文链接：https://blog.csdn.net/weixin_46408961/article/details/123343881

版权

这篇博客介绍了如何使用 PySpark 的 `ElementwiseProduct` 类来对数据帧中的向量执行元素级（Hadamard）乘法。首先创建了一个 SparkSession，然后生成了一个包含向量的数据框。接着展示了如何通过设置不同的 `scalingVec` 参数来缩放向量，输出了不同的结果。最后，通过 `setParams` 方法重新设置 `scalingVec` 并再次应用变换。

摘要由CSDN通过智能技术生成

ElementwiseProduct

class pyspark.ml.feature.ElementwiseProduct(scalingVec=None, inputCol=None, outputCol=None)

使用提供的“权重”向量输出每个输入向量的 Hadamard 乘积（即元素乘积）。换句话说，它通过标量乘数缩放数据集的每一列

01.初始化

from pyspark.sql import SparkSession
spark = SparkSession.builder.config("spark.Driver.host","192.168.1.3")\
    .config("spark.ui.showConsoleProgress","false")\
    .appName("ElementwiseProduct").master("local[*]").getOrCreate()

02.生成数据

from pyspark.ml.linalg import Vectors
df = spark.createDataFrame([(Vectors.dense([2.0, 1.0, 3.0]),)], ["values"])
df.show()

输出结果：

+-------------+
|       values|
+-------------+
|[2.0,1.0,3.0]|
+-------------+

03.按照向量进行缩放

from pyspark.ml.feature import ElementwiseProduct
elementwiseProduct = ElementwiseProduct(inputCol="values",scalingVec=Vectors.dense([9.0,8.0,7.0]),outputCol="res")
elementwiseProduct.transform(df).show()

输出结果：

+-------------+---------------+
|       values|            res|
+-------------+---------------+
|[2.0,1.0,3.0]|[18.0,8.0,21.0]|
+-------------+---------------+

04.按照另一个向量进行缩放

elementwiseProduct2 = ElementwiseProduct(inputCol="values",scalingVec=Vectors.dense([9.0,2.0,3.0]),outputCol="res")
elementwiseProduct2.transform(df).show()

输出结果：

+-------------+--------------+
|       values|           res|
+-------------+--------------+
|[2.0,1.0,3.0]|[18.0,2.0,9.0]|
+-------------+--------------+

05.重新设置参数，并进行缩放：

elementwiseProduct2.setParams(scalingVec=Vectors.dense([1.0,2.0,3.0]))
elementwiseProduct2.transform(df).show()

输出结果：

+-------------+-------------+
|       values|          res|
+-------------+-------------+
|[2.0,1.0,3.0]|[2.0,2.0,9.0]|
+-------------+-------------+

Gadaite

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫