机器学习
文章平均质量分 62
若小鱼
这个作者很懒,什么都没留下…
展开
-
【机器学习】笔记 4、KNN+交叉验证
KNN分类模型概念:简单地说,K-近邻算法采用测量不同特征值之间的距离方法进行分类(k-Nearest Neighbor ,KNN)k值的作用欧几里得距离在scikit-learn库中使用k-近邻算法 # 鸢尾花分类实现import sklearn.datasets as dsfrom sklearn.neighbors import KNeighborsClassifierfrom sklearn.model_selection import train_test_split原创 2021-08-06 15:19:18 · 4213 阅读 · 0 评论 -
【机器学习】笔记 3、sklearn的数据集
sklearn的数据集数据集划分训练集:训练模型测试集:评估模型数据集划分的APIfrom sklearn.model_selection import train_test_splittrain_test_split(x,y,test_size,random_state)参数介绍x:特征y:目标test_size:测试集的比例random_state:打乱的随机种子返回值:训练特征,测试特征,训练目标,测试目标数据集接口介绍sklearn.datasets.lo原创 2021-08-06 15:03:58 · 336 阅读 · 0 评论 -
【机器学习】笔记 2、特征工程
特征工程特征抽取 数据特征的预处理 特征选择 为什么需要特征工程 样本数据中的特征有可能会存在缺失值i,重复值,异常值等等,那么我们是需要对特征中的相关的噪点数据进行处理的,那么处理的目的就是为了营造出一个更纯净的样本集,让模型基于这组数据可以有更好的预测能力。当然特征工程不单单只是处理上述操作! 什么是特征工程 特征工程的意义 直接影响模型预测的结果 如何实现特征工程 工具-sklearn sklearn介绍 是python语言中的机器学习工具,包含了很多知名的机器学原创 2021-08-06 14:39:29 · 316 阅读 · 0 评论 -
【机器学习】笔记 1、概述
什么是机器学习 官方解释 机器学习就是从【数据】中自动分析获得【规律(模型)】,并利用规律对未知数据进行【预测】的算法 模型 算法模型,是一个特殊的对象。该算法模型对象中已经纪衡或者封装好了某种形式的方程/算法。(还没有求出解的方程) 模型的作用 预测 分类 (注意:算法模型对应的算法或者方程求出的解就是预测或者分类的结果) 样本数据 模型的训练:将样本数据带入到模型中,对其进行训练(给方程进行求解操作),模型训练好以后,则模型原创 2021-08-06 12:00:46 · 266 阅读 · 0 评论 -
运行spark.ml和spark.mllib时报错java.lang.NoClassDefFoundError解决方法
在运行spark.ml机器学习库时,执行失败,错误日志为Exception in thread “main” java.lang.NoClassDefFoundError: org/apache/spark/ml/recommendation/ALS…Caused by: java.lang.ClassNotFoundException: org.apache.spark.ml.recomm...原创 2019-02-19 17:14:07 · 2684 阅读 · 1 评论