自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 Kaggle学习之Machine Learning from Disaster(2) -SVM

一、SVM介绍(以下来自百度百科词条SVM)SVM方法是通过一个非线性映射p,把样本空间映射到一个高维乃至无穷维的特征空间中(Hilbert空间),使得在原来的样本空间中非线性可分的问题转化为在特征空间中的线性可分的问题。简单地说,就是升维和线性化。升维,就是把样本向高维空间做映射,一般情况下这会增加计算的复杂性,甚至会引起“维数灾难”,因而人们很少问津.但是作为分类、回归等问题来说,很可能在低维样

2017-09-25 23:29:29 257

原创 Kaggle学习之Machine Learning from Disaster(1)

一、背景介绍Jack and Rose唯美的爱情故事很壮观却很悲凉~大船船体进水后,是否获救的乘客是随机的还是具有某些规律的呢? 是否可以根据乘客的基本信息和存活信息来预测其他人的存活信息呢?So,这是一个二分类问题。常见的二分类算法有:线性/逻辑回归、SVM、决策树、随机森林、boost算法等。二、数据预处理数据下载地址如下: https://www.kaggle.com/c/titanic/

2017-09-24 20:42:33 360

原创 Pythton数据爬去(2)-爬取所有页数据

…… 经过上篇初爬后,我们得到《谁说菜鸟不会数据分析》第一页数据。{'productAttr': None, 'productCommentSummary': {'goodRateShow': 97, 'poorRateShow': 1, 'poorCountStr': '80+', 'averageScore': 5, 'generalCountStr': '200+', 'oneYear':

2017-07-23 23:14:27 664

原创 小白玩转爬虫!(Python)

小白在学习Python基础教程一个月后,决定开始干爬虫。Spider!!! 视频:小蚊子爬虫实战 工具:Pycharm。1、概述 商品评论数据属于不开放数据接口。不开放数据接口是指公开的网站中,可以获取的数据,但是不公开数据接口。!公开: 允许公众访问:例如电商商品价格、介绍、评论等; 限制全站抓取:例如限制session、cookie、header等。2、分析接口案例 目的:抓取《谁说

2017-07-18 22:56:13 1110

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除