从事机器学习,数据分析,数据挖掘的同学们以及python使用者 选择经典案例基于真实数据集,从数据预处理开始到建立机器学习模型以及效果评估,完整的讲解如何使用python及其常用库进行数据的分析和模型的建立。对于每一个面对的挑战,分析解决问题思路以及如何构造合适的模型并且给出合适评估方法。在每一个案例中,同学们可以快速掌握如何使用pandas进行数据的预处理和分析,使用matplotlib进行可视化的展示以及基于scikit-learn库的机器学习模型的建立
课时01.课程简介
课时02.课程数据,代码下载
课时03.使用Anaconda搭建python环境
课时04.Kobe.Bryan生涯数据读取与简介
课时05.特征数据可视化展示
课时06.数据预处理
课时07.使用scikit-learn建立分类模型
课时08.数据简介及面临的挑战
课时09.数据不平衡问题解决方案
课时10.逻辑回归进行分类预测
课时11.使用阈值来衡量预测标准
课时12.使用数据生成策略
课时13.数据简介与特征课时化展示
课时14.不同特征的分布规则
课时15.决策树模型参数详解
课时16.决策树中参数的选择
课时17.将建立好决策树可视化展示出来
课时18.船员数据分析
课时19.数据预处理
课时20.使用回归算法进行预测
课时21.使用随机森林改进模型
课时22.随机森林特征重要性分析