自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 使用adaboost做Kaggle中Titanic

这里测试了使用adaboost的效果,代码如下:#coding=utf-8import pandas as pdfrom pandas import Series,DataFrame import randomimport numpy as npfrom datetime import dateimport datetime as dtfrom numpy import nan as

2018-02-26 16:58:30 993

原创 统计手机品牌的市场占有率

首先在kaggle上得到一组数据,https://www.kaggle.com/c/talkingdata-mobile-user-demographics,比赛是2016年开始,所以数据估计是2015左右的。 直接下载phone_brand_device_model.csv.zip,然后统计每个手机品牌出现的次数的比例,作为市场占有率,最后绘制柱状图:#coding=utf-8import p

2018-02-23 11:50:09 4042

原创 matlab粒子群算法例子

matlab上使用粒子群算法求函数的最大值: 函数:f(x, y) = x*cos(2*pi*y) + y*sin(2*pi*x) -2≤x≤2,-2≤y≤2%% I. 清空环境clcclear%% II. 绘制目标函数曲线figure[x,y] = meshgrid(-2:0.1:2,-2:0.1:2);z = x*cos(2*pi*y) + y*sin(2*pi*x);mes

2018-02-22 14:25:42 12519 4

原创 kaggle House Prices项目

House Prices项目可是麻烦, 首先一样的,先读取数据:#coding=utf-8import pandas as pdfrom pandas import Series,DataFrame import randomimport numpy as npfrom datetime import dateimport datetime as dtfrom numpy impor

2018-02-22 10:49:28 656

原创 Kaggle中Titanic项目简单入门

首先,再kaggle注册帐号,找到Titanic项目,9659个队伍,估计全部都是菜鸟: 下载train和test集,提交的文件: 首先,二话不说,先把下载的《gender_submission.csv》直接提交上去: 这样,我们就得到了第一个成绩:0.76555,还行,好歹比2xxx多个队伍强。 再看看说明,最终评价的标准是ACC 下面开始正式干活了: 先导入各种库,读取训

2018-02-11 17:06:19 3685 1

原创 使用opencv默认的hog行人检测器来检测视频中的行人

opencv中有训练好的hog行人检测器,可以直接用来做行人检测,下面是代码:#include "stdafx.h"#include <opencv2/core/core.hpp> #include "opencv2/opencv.hpp"#include "opencv2/imgproc/imgproc.hpp"#include <opencv2/highgui/highgui.hpp>

2018-02-11 10:07:30 4030

原创 python xgboost分析婚外情几率

最近刚刚学习到xgboost,据说效果杠杠的,神器啊 这里是一个使用的小例子: 1 我用的是Anaconda,先安装xgboost 2 数据集:(课程作业,我也不知道这个数据集哪里来的) 数据集Affairs.csv,取自于1969年《今日心理》(Psychology Today)所做 的一个非常有代表性的调查,而Greene(2003)和Fair(1978)都对它进行过分析。该数据从60

2018-02-07 12:01:50 1401

原创 Gini,信息熵,分类误差的2个题目

题目一: 我的答案:a) 男有10个,女有10个,所以,如果要计算性别的Gini值的话,根据Gini值公式: 1-(10/20)* (10/20)-(10/20)* (10/20)=0.5 b)按照车型多路划分: 家用 运动 豪华 C0 1 8 1 C1 3 0 7 根据Gini值公式: 家用的Gini=1-(1/4)* (1/4)-(3/4)*

2018-02-05 22:41:47 4174

原创 matlab使用遗传算法找函数极值

使用遗传算法寻找函数极值%% I. 清空环境变量clear allclc%% II. 绘制函数曲面xx = -2:0.01:2;yy = -2:0.01:2;[x,y] = meshgrid(xx,yy);z = x*cos(2*pi*y) + y*sin(2*pi*x) ;mesh(x,y,z)shading interpxlabel('x');ylabel('y');zlabel

2018-02-05 13:14:28 5003 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除