Kaggle系列
文章平均质量分 81
hhy518518
这个作者很懒,什么都没留下…
展开
-
kaggle简单框架总结
摘要:分析过程在ipython notebook笔记中。下面主要贴一下这道题的代码框架。#-*-coding:utf-8-*-import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom sklearn import preprocessingfrom sklearn.ensemble原创 2017-02-05 21:36:24 · 2463 阅读 · 1 评论 -
kaggle模型融合简单入门
#这个题属性其实就两种 类别属性和数值属性 和Tantic不太一样我们可以统一处理#处理类别属性但是值却是数字的特征#MSSubClass 的值其实应该是一个category,是住宅属性 可是取值却是整数#所以我们考虑将这个类的类型重新确定def processMSSubClass(df): df['MSSubClass']=df['MSSubClass'].astype(str)原创 2017-02-07 20:51:54 · 6064 阅读 · 0 评论 -
GBDT参数调优
摘要:此处主要是如何利用xgboost以及如何进行Xgboost调参,特征工程处理的比较简单。特征工程:City这个变量已经被我舍弃了,因为有太多种类了。DOB转为Age|DOB,舍弃了DOB创建了EMI_Loan_Submitted_Missing这个变量,当EMI_Loan_Submitted 变量值缺失时它的值为1,否则为0。然后舍弃了EMI_Loan_Submi原创 2017-02-10 21:51:43 · 21936 阅读 · 0 评论 -
XGBoost参数调优
摘要:转载:http://blog.csdn.net/han_xiaoyang/article/details/526653961. 简介如果你的预测模型表现得有些不尽如人意,那就用XGBoost吧。XGBoost算法现在已经成为很多数据工程师的重要武器。它是一种十分精致的算法,可以处理各种不规则的数据。 构造一个使用XGBoost的模型十分简单。但是,提高这个模型转载 2017-02-12 17:52:17 · 5923 阅读 · 1 评论 -
Kaggle_news_stock简单文本特征处理
摘要:这个是https://www.kaggle.com/aaron7sun/stocknews上面的一道DJIA波动预测题,其实也是二分类问题也是个文本分类问题,特征是文本类型基本方法是:TF-IDF + SVM 是文本分类问题的基准线开始数据探索import pandas as pdimport numpy as npfrom sklearn.svm impor原创 2017-02-12 22:11:21 · 1849 阅读 · 0 评论