机器学习建模过程

这篇博客介绍了机器学习建模的过程,特别是监督学习中的分类算法。作者分享了自己的学习路线,包括从理论到实践学习各种算法,如决策树、随机森林、LightGBM和XGBoost。文中提到了数据分析和预处理的重要性,并提供了这三个模型的建模简要代码,鼓励读者深入研究算法内部原理。
摘要由CSDN通过智能技术生成

机器学习建模

机器学习看上去和听上去感觉高大上,但一层层拨开它的面纱就会发现从理解到应用没有那么的困难,下面简单介绍一下我的个人经验。

机器学习分为监督学习和无监督学习,无监督学习里面包含聚类,降维等,监督学习包括分类和回归,个人觉得机器学习里面最重要的库是sklearn

具体有关的参数以及超参都可以查看https://scikit-learn.org/stable/的api。

首先介绍一下我的学习路线,我当时学习机器学习的时候是看唐宇迪的机器学习视频,感觉他讲的非常不错,包括后期学深度学习也看了吴恩达的视频等等。

第一:定计划,列下目前的机器学习方法(线性回归,岭回归,逻辑回归,贝叶斯,决策树,随机森林,lightgbm,xgboost,svm,k_means,pca,aporia关联算法等等)

然后开始计划一周学习一个算法(从理论到实践::其实用不到一周,而且不用全部都学,有的到用的时候再学)

因为机器学习中分类算法用的较多,下面举例分类算法的机器学习处理过程。

数据分析以及预处理

# 1.数据分析
# 分类的0,1分布(一般指二分类),数据的整体情况等
# 特征的类型,特征的数值分布,特征对类别的分布等
# 特征的空值率,特征的熵,特征的降维,特征的共线性,特征的筛选等
import matplotlib.pyplot as plt
import pandas as pd
df.label.value_counts()
df.info()

#画图
%matplotlib inline
%config InlineBackend.figure_format = 'png'
ax = df.query('Survived == 0')['Age'].plot(kind = 'density',
                      figsize = (12,8),fontsize=15)
df.query('Survived == 1')['Age'].plot(kind = 'density',
                      figsize = (12,8),fontsize=15)
ax.legend(['Survived==0','Survived==1'],fontsize = 12)
ax.set_ylabel('Density',fontsize
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值