- 博客(2)
- 收藏
- 关注
原创 调用pyspark.ml库对信用卡逾期进行预测
导包 from pyspark import SparkConf,SparkContext from pyspark.ml.classification import RandomForestClassifier from pyspark.ml.classification import DecisionTreeClassifier from pyspark.ml.classification import LogisticRegression from pyspark.ml import Pipeline
2022-01-10 17:20:39
894
原创 Pyspark数据分析之信用卡月收入统计
Pyspark数据分析之信用卡月收入统计@信用卡逾期分析 from pyspark import SparkConf,SparkContext conf=SparkConf().setAppName('PreofOverdue').setMaster('local[*]') sc=SparkContext(conf=conf) 从HDFS读数据 data=sc.textFile('hdfs://localhost:9000/bigwork/traindata.csv').map(lambda x:x.s
2022-01-10 17:12:53
703
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人