ml 聚类分析

之前写的那个太粗糙了。这次认真一点来学一学。

先贴上之前的笔记链接:https://www.cnblogs.com/ivanxy/articles/9656395.html

之前的代码实操在:http://localhost:8888/notebooks/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E8%AF%BE%E7%A8%8B%E8%B5%84%E6%96%99/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E7%AE%97%E6%B3%95%E9%85%8D%E5%A5%97%E6%A1%88%E4%BE%8B%E5%AE%9E%E6%88%98/%E8%81%9A%E7%B1%BB%E7%AE%97%E6%B3%95/kmeans-dbscan.ipynb

 

转载于:https://www.cnblogs.com/ivanxy/p/10340142.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
以下是基于Spark ML以Scala语言编写的鸢尾花聚类分析示例代码: ```scala import org.apache.spark.ml.clustering.KMeans import org.apache.spark.ml.feature.{StandardScaler, VectorAssembler} import org.apache.spark.sql.SparkSession object IrisClustering { def main(args: Array[String]): Unit = { // 初始化SparkSession val spark = SparkSession.builder() .appName("Iris Clustering") .master("local[*]") .getOrCreate() // 加载鸢尾花数据集 val data = spark.read .format("csv") .option("header", "true") .option("inferSchema", "true") .load("iris.csv") // 特征向量转换器 val assembler = new VectorAssembler() .setInputCols(Array("sepal_length", "sepal_width", "petal_length", "petal_width")) .setOutputCol("features") // 标准化转换器 val scaler = new StandardScaler() .setInputCol("features") .setOutputCol("scaled_features") .setWithStd(true) .setWithMean(false) // 数据预处理 val transformedData = assembler.transform(data) val scaledData = scaler.fit(transformedData).transform(transformedData) // 聚类模型训练 val kMeans = new KMeans() .setK(3) .setSeed(1L) .setFeaturesCol("scaled_features") .setPredictionCol("cluster") val model = kMeans.fit(scaledData) // 聚类结果展示 val predictions = model.transform(scaledData) predictions.show() // 关闭SparkSession spark.stop() } } ``` 在这个示例中,我们首先加载了鸢尾花数据集并使用`VectorAssembler`将特征向量组合在一起。然后,我们使用`StandardScaler`对特征向量进行标准化处理。接下来,我们使用`KMeans`算法对数据集进行聚类,并使用`transform`方法将每个样本分配到最近的簇中。最后,我们将聚类结果输出并关闭SparkSession。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值