python数据挖掘---建模篇(附代码)

这篇博客详细记录了机器学习中常见的模型构建过程,包括数据划分、数据标准化及回归、分类、聚类和推荐算法。涉及线性回归、Lasso、Ridge、Logistic、KNN、决策树、随机森林、GBDT等模型,并提供了相应的Python代码实现。
摘要由CSDN通过智能技术生成

数据挖掘路上点点滴滴,记录下机器学习常用模型(附代码),持续更新

 

数据划分

x_train1, x_test1, y_train1, y_test1 = train_test_split(x, y, train_size=0.8, random_state=14)

 

数据标准化

树类模型不需要,使数据符合N(0,1)分布。很多ML的算法要求训练的输入参数的平均值是0并且有相同阶数的方差例如:RBF核的SVM,L1和L2正则的线性回归

from sklearn.preprocessing import StandardScaler

ss= StandardScaler()

x_train=ss.fit_transform(x_train)

x_test=ss.transform(x_test)

 

回归:

 

线性回归算法模型构建

lr = LinearRegression()

lr.fit(x_train,y_train)

lr_y_test_hat = lr.predict(x_test)

lr_score = lr.score(x_test, y_test)

print ("lr:", lr_score)

 

Lasso回归算法模型构建

from sklearn.linear_model import Lasso

lasso = LassoCV(alphas=np.logspace(-3,1,20))

  • 8
    点赞
  • 57
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值