19、Python数据特征选择,模型选择法

 1  模型选择法

把建好的模型对象传入选择器,然后根据这个已经建好的模型,自动帮我们选择最好的特征值。

2 案例代码


import pandas

data = pandas.read_csv('D:\\database\\pystudy\\6.2\\data2.csv')


# 导入线性回归方程和模型选择方法


from sklearn.linear_model import LinearRegression

from sklearn.feature_selection import SelectFromModel


# 自变量特征

feature=data[['月份','季度','广告费用','客流量']]

# 建立线性回归模型

LrModel= LinearRegression()

# 建立选择回归模型

selectFromModel= SelectFromModel(LrModel)

# fit方法训练选择,自动选择最优的特征数

selectFromModel.fit_transform(
        feature,
        data['销售额']
        )


feature.columns[selectFromModel.get_support()] 

 

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
针对疫情数据分析建立模型的话题比较广泛,我可以给您提供一个简单的例子,帮助您了解如何使用Python进行建模。 在此例子中,我们将使用Python的Pandas、Matplotlib和Scikit-learn库来建立一个简单的线性回归模型,用于预测COVID-19确诊人数与死亡人数之间的关系。以下是该模型的步骤: 1. 收集数据:我们可以从世界卫生组织(WHO)的网站上下载COVID-19的确诊和死亡数据,保存为CSV文件。 2. 数据清洗:使用Pandas库将数据加载到数据帧中,并进行数据清洗和预处理,例如删除缺失值、转换数据类型等。 3. 数据可视化:使用Matplotlib库将数据可视化,例如绘制时间序列图、散点图等。 4. 特征工程:根据我们的问题,选择合适特征,例如时间、地区、人口等,并进行特征工程,例如特征选择特征缩放等。 5. 建立模型:使用Scikit-learn库建立线性回归模型,将确诊人数作为自变量,将死亡人数作为因变量,并训练模型。 6. 模型评估:使用评估指标,例如均方误差(MSE)、R平方值等,对模型进行评估,确定模型的准确性和可靠性。 7. 模型预测:使用模型进行预测,例如预测未来一段时间内的死亡人数,从而帮助我们了解疫情的发展趋势。 需要注意的是,该模型仅仅是一个简单的示例,实际情况下可能需要更复杂的模型和更多的特征。 希望这个简单的例子能够帮助您了解如何使用Python进行疫情数据分析建模。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值