机器学习03

缺失值处理

在这里插入图片描述
过程中出现以下报错
cannot import name ‘Imputer’ from ‘sklearn.preprocessing’
原因是由于python版本和sklearn版本不对等。
解决方法:

from sklearn.impute import SimpleImputer as Imputer
def im():
    #缺失值处理
    im=Imputer(missing_values=np.nan,strategy='mean')
    #mean是平均值的意思
    data=im.fit_transform([[2.0,3.0],[np.nan,6.0],[3.1,7.6]])
    print(data)
    
im()

运行结果:
[[2.   3.  ]
 [2.55 6.  ]
 [3.1  7.6 ]]

注:missing_values后的参数不能为NaN,只能使用np.nan
api参数列表:
在这里插入图片描述

数据降维之特征选择

特征选择的原因
在这里插入图片描述
特征选择的三大方法
在这里插入图片描述

过滤式:对方差进行过滤(方差var=0,表示某特征一列数据都一样,也就是说,这个特征对于预测没意义,所以通过方差来对特征进行一个选择)。

from sklearn.feature_selection import VarianceThreshold
def var():
    #特征选择--删除低方差的特征
    var=VarianceThreshold(threshold=0.0)  #删除方差等于0的特征,也就是数据一样的特征
    data=var.fit_transform([[0,2,3],[0,2,4],[0,1,6]])
    print(data)
    
var()

运行结果:
[[2 3]
 [2 4]
 [1 6]]

其他特征过滤方法:神经网络。

PCA(主成分分析)

在这里插入图片描述
将高维的数据简化为低维的数据
在这里插入图片描述

from sklearn.decomposition import PCA
def pca():
    #主成分分析
    pca=PCA(n_components=0.9)
    data=pca.fit_transform([[0,2,3,7],[0,2,4,8],[0,1,6,11]])
    print(data)
    
pca()

运行结果:
[[-2.15470054]
 [-0.78867513]
 [ 2.94337567]]
 #变成了一个特征


案例

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

pd.merge()   #合并表的数据
pd.crosstab()   #传两个参数,指定行,指定列

在这里插入图片描述
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
A03机器学习流程是指在进行机器学习项目时所需要遵循的一系列步骤。下面是A03机器学习流程的主要步骤: 1. 数据收集与观察:首先,需要收集与问题相关的数据,并对数据进行观察,了解数据的特征、缺失值以及异常值等情况。 2. 数据预处理:对收集到的数据进行预处理,包括数据清洗、特征选择、特征变换等操作,目的是为了提高模型的性能和准确性。 3. 模型选择与训练:选择合适的机器学习模型,并对模型进行训练。常见的机器学习模型包括决策树、支持向量机、神经网络等。 4. 模型评估与调优:通过评估模型在测试集上的性能指标(如准确率、召回率等),来判断模型的优劣。如果模型性能不佳,需要对模型进行调优,常用的调优方法包括超参数调整、交叉验证等。 5. 模型部署与应用:将训练好的模型部署到实际应用中,并对新的数据进行预测和分类。 6. 模型监控与更新:对已部署的模型进行监控,定期更新模型参数,以保证模型的准确性和稳定性。 A03机器学习流程能够帮助我们在机器学习项目中有条不紊地进行工作,并且能够提高模型的性能和准确性。每个步骤都需要认真对待,对于数据的收集与预处理要尤为重视,因为数据的质量直接关系到模型的准确性。此外,在模型选择与训练中,根据具体问题的特点选择合适的模型也是十分重要的一步。最后,对模型进行评估、调优以及部署与更新也是不可忽视的步骤,它们能够提高模型的稳定性和持续性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值