自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 steam_predicted

提供的数据集是txt,先手动将文件后缀改为csv即可利用pandas处理数据import pandas as pdpath_train = 'D:\\Dataset\\Tianchi\\zhengqi_train.csv'path_test = 'D:\\Dataset\\Tianchi\\zhengqi_test.csv'df_train_data = pd.read_csv(path_...

2018-10-31 23:04:01 143

原创 房屋售价初体验

第二次学习继续采用Kaggle上面的一个经典竞赛——房屋售价预测。刚刚下载过数据文集后看到七十多种属性还是懵了一下,要比Titanic数据集稍显复杂,而且房价预测不是简单的dead or alive这样的二分类问题。所以第一次接触这样的预测模型我依然先参考一个较高的rank script,先对预测流程有所认识,再对模块进行学习。和上一篇Titanic预测结构类似:数据集认识->缺失值处理-...

2018-09-30 23:00:29 277

原创 Titanic分析&预测(二)

这次实验参考的是一个投票数最多的kernel,采用的是集成学习(Ensemble Learning)的思想。 集成学习(ensemble learning)会构建并结合多个学习器来完成学习任务,有时也被称为多分类器系统(multi-classifier system)、基于委员会的学习(committee-based learning)等。 (摘自《机器学习...

2018-09-05 21:01:16 352 1

原创 Titanic分析&预测(一)

IDE: Pycharm + Python 3 目标:根据已有数据集中的年龄、性别等属性和存活与否,建立回归模型,并利用测试集提供的数据,进行存活预测。本次实验采用Logistic Regression需要引用的包#encoding=utf-8import numpy as npimport pandas as pdimport matplotlib.pyplot as plt...

2018-08-29 22:23:42 549

原创 markdown编辑器使用指南

欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I...

2018-08-28 22:25:39 90

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除