数据分析
文章平均质量分 72
想成为风筝
自学过程中的经验与干货
展开
-
Scikit-learn(sklearn)机器学习必备库
sklearn介绍原创 2022-07-13 17:40:59 · 1023 阅读 · 0 评论 -
机器学习--线性回归(sklearn)
机器学习线性回归(sklearn)原创 2022-07-03 17:17:48 · 3336 阅读 · 0 评论 -
Kaggle竞赛-Two Sigma Connect: Rental Listing Inquiries(XGBoost)
根据租房网站上的数据信息,预测房子的受欢迎程度。(这是一个分类问题,包含以下数据,有类别变量、整数变量、文本变量)。使用sklearn完成建模预测。数据集可在竞赛官网下载。关于XGBoost的讲解,这里不再介绍了。后续,会出一系列的机器学习算法讲解。TfidfVectorizer, CountVectorizer查看sklearn官网或者TfidfVectorizer, CountVectorizer...原创 2022-06-17 20:49:03 · 471 阅读 · 0 评论 -
sklearn之feature_extraction.text.CountVectorizer / TfidVectorizer
机器学习数据分析原创 2022-06-17 14:52:59 · 1319 阅读 · 0 评论 -
Python数据分析之可视化数据matplotlib/seaborn
python数据可视化原创 2022-06-16 23:39:37 · 233 阅读 · 0 评论 -
Kaggle竞赛-Two Sigma Connect: Rental Listing Inquiries
kaggle竞赛-Two Sigma Connect: Rental Listing Inquiries原创 2022-06-16 20:34:32 · 407 阅读 · 0 评论 -
数据分析之缺失值填充(重点讲解多重插值法Miceforest)
数据分析之缺失值填充(重点讲解多重插值法Miceforest)数据分析的第一步——数据预处理,不可缺失的一步。为了得到更好的结果,选择合适的数据处理方法是非常重要的!数据预处理之缺失值填充在大数据样本时,缺失少量的数据时,可以选择直接剔除,也可以按照某种方法进行填充。在小数据样本时,只能选择填充缺失值。缺失值填充的常用方法:均值填充、众数填充、多重插值法(更适用于多模态数据,例如医学数据)、K近邻填充、回归/分类预测填充(线性回归、非线性回归、随机森林等多种机器学习方法,或神经网络)。常用且简单的方原创 2022-05-24 22:34:08 · 16243 阅读 · 9 评论