机器学习
文章平均质量分 79
三笔竹林
程序媛的自我修养
展开
-
Kaggle Titanic 机器学习实践笔记
目录结构是这个样子的:Titanic --data (放官网的数据) -train.csv -test.csv -gender_submission.csv --program -data_exploration.py做题先审题,在官网的data页里能看到对于各字段的说明:Data Dictionary原创 2017-12-04 17:02:11 · 1642 阅读 · 0 评论 -
Kaggle Titanic 机器学习实践笔记(二)
Kaggle titanic数据预处理填补空缺值baseline_modellearning_curve原创 2017-12-04 22:04:42 · 650 阅读 · 0 评论 -
Kaggle Titanic 模型优化提升第三弹
参考网站:模型融合的理论教程:http://m.blog.csdn.net/shine19930820/article/details/75209021原创 2017-12-06 12:16:42 · 476 阅读 · 0 评论 -
Kaggle Mercari Price Suggestion
参赛经验代码技巧积累计算时间文件读取动态获取数据集行列数 Series转DataFrame便捷写法一句话把某列是否为空变成新的一列特征loclambda x xindex missing第一次见frozensetFeature UnionPipeline细节详解fit_transform和transform的区别ItemSelector用于选择某列Hashing...原创 2018-02-17 19:32:21 · 1372 阅读 · 0 评论 -
Microsoft Azure Machine Learning使用探索
写在前面感谢公司提供的Microsoft Azure 机器学习平台 我不是微软的托哈,但是一用觉得,这东西太方便了吧! 最大的优点在于快速试错上传数据集添加新的实验在页面最左下角有一个加号,点一下然后是下图: 选黄色的加号然后到实验区,把输入的csv拽进来 点这个训练数据集,右键选visualize可视化 众所周知Titanic数据集里有PClas...原创 2018-03-28 10:06:29 · 2182 阅读 · 1 评论 -
用Python复现R 时序预测相关函数
项目数据PN_IB是2011-03-1到2019-10-01的数据,以月为分隔符 PN_usage是2011-06-25到2017-08-05的数据,以周为分割 long_term_pred_results 2014-10-04到2018-03-31项目结构基础语法读取文件usage = read.csv('data/TopmostPN_filter_weekl...原创 2018-05-11 16:26:33 · 817 阅读 · 0 评论