![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
data-mining
文章平均质量分 57
BVL10101111
THU master, interested in ML,DL,DM
github:https://github.com/BenchengY
展开
-
Data Mining Competition中数据缺失值处理
在数据挖掘以及机器学习中,拿到的数据,经常是某些记录的某些字段是缺失的,面对这种情况,可以有以下几种处理方法:1.直接drop这条记录 2.缺失值用众数填补 3.缺失值用中位数填补 4.缺失值用rand(mean-std,mean+std)随机数填补原创 2017-06-02 21:19:31 · 1635 阅读 · 1 评论 -
python机器学习实战之 Decision Tree For Titanic in Kaggle
最近陆续准备熟悉一下sklearn库,在此做一下记录。这篇文章是简短的对于decision tree的kaggle上的实战记录,详细的请见github一.数据集:Titanic 是一个二分类问题,给你每个人的一些feature,判断最后是否会Survive。 二.数据处理:参考here1.丢弃无用的'PassengerId','Name','Ticket'特征2.Embarked,one-hot原创 2017-06-04 12:31:18 · 1699 阅读 · 1 评论 -
推荐系统经典论文文献及业界应用
Survey方面的文章及资料Adomavicius G, Tuzhilin A. Toward the next generation of recommender systems: A survey of the state-of-the-art and possible extensions[J]. Knowledge and Data Engineering, IEEE Transaction转载 2017-12-16 22:46:12 · 2512 阅读 · 0 评论