机器学习
想当兔纸的猫
心之所向,素履以往。
展开
-
机器学习-训练模型的保存与恢复(sklearn)
机器学习-训练模型的保存与恢复(sklearn)转载 2017-12-20 14:18:07 · 5551 阅读 · 0 评论 -
机器学习之离散型特征的处理-one hot encoder
转载自https://www.cnblogs.com/daguankele/p/6595470.html 1、什么是独热码 独热码,在英文文献中称做 one-hot code, 直观来说就是有多少个状态就有多少比特,而且只有一个比特为1,其他全为0的一种码制。在机器学习中对于离散型的分类型的数据,需要对其进行数字化比如说性别这一属性,只能有男性或者女性或者其他这三种值,如何对这三个值进转载 2018-01-31 14:49:49 · 8204 阅读 · 0 评论 -
PySpark 学习笔记四
4 Introducing MLlib MLlib 即Machine Learning Library。 4.1 载入数据并转换数据 数据集下载:births_train.csv.gz.。 创建数据集的schema:import pyspark.sql.types as typlabels = [ ('INFANT_ALIVE_AT_REPORT', typ.Strin原创 2018-01-18 18:01:14 · 9808 阅读 · 1 评论 -
PySpark 学习笔记五
5 Introducing the ML Package 在前面,我们使用了Spark中严格基于RDD的MLlib包。 在这里,我们将基于DataFrame使用MLlib包。 另外,根据Spark文档,现在主要的Spark机器学习API是spark.ml包中基于DataFrame的一套模型。 5.1 ML包的介绍 从顶层上看,ML包主要包含三大抽象类:转换器、预测器和工作流。5.1.1原创 2018-01-22 10:38:34 · 10411 阅读 · 0 评论