数据挖掘机器学习实战
login_sonata
这个作者很懒,什么都没留下…
展开
-
Kaggle比赛经验总结之Titanic: Machine Learning from Disaster
这是个根据旅客信息判断他是否幸存的二分类问题,适合机器学习新手入门。本文记录了我大致的处理思路和步骤,然后总结了一下经验,同时有助于特征工程和pandas的学习。 我的准确率:0.80383 代码地址:点我一,观察数据: •PassengerID(ID) •Survived(存活与否) •Pclass(客舱等级,较为重要) •Name(姓名,可提取出更多信息) •Se原创 2017-01-10 16:39:49 · 6527 阅读 · 2 评论 -
2016CCF大数据与计算智能大赛——搜狗用户画像比赛总结
一,赛题介绍赛题提供10万个用户在一个月内的搜索引擎查询词,与该用户的属性标签(包括性别、年龄、学历)做为训练数据,用机器学习和数据挖掘的方法构建模型,去对新增用户的未知属性进行预测(已知信息即用户的搜索词),其中性别是二分类问题,年龄和学历都是六分类问题。 赛事官网为www.datafountain.cn,比赛自16年10月开始,历时两个月。 我们队伍最终排名为30/894,B榜准确率为原创 2017-05-01 17:58:29 · 6107 阅读 · 1 评论 -
win10安装xgboost python版
本文方法中使用的python版本为2.7,默认你已经安装了anaconda,操作系统为win10,步骤如下: 一,下载已经编译好的xgboost,下载链接点我。 二,解压它,把整个xgboost文件复制到“你的python目录\Lib\site-packages”路径下。 三,进入上述目录下的xgboost文件下的python-package文件中,按住shift点击鼠标右键,进入当前目录的c翻译 2017-05-16 20:41:34 · 2349 阅读 · 2 评论 -
TensorFlow入门(基础语法,小程序)
本文参考自:莫烦Python - Tensorflow 教程系列TensorFlow入门:使用图 (graph) 来表示计算任务.在被称之为 会话 (Session) 的上下文 (context) 中执行图.使用 张量(tensor) 表示数据.通过 变量 (Variable) 维护状态.使用 feed 和 fetch 可以为任意的操作(arbitrary operation) 赋值或者从原创 2017-08-27 15:17:04 · 10687 阅读 · 2 评论