GridSearchCV 与 RandomizedSearchCV 调参

  好久没写博客了,原因是最近比较忙,一下报了两个比赛,今天终于最后一个比赛的初赛都结束了,抽点小空赶紧总结一下,先汇报下成绩吧。IJCAI2018 阿里妈妈广告算法大赛,初赛第六。FASHIONAI属性识别大赛初赛25 。复赛加油,争取取得更好的成绩。   昨天和前天都加班调参了,但是由于是新手...

2018-04-23 16:13:32

阅读数:3

评论数:0

IJCAI18 阿里妈妈广告

   比赛的说明,还有比赛的链接IJCAI18   详细代码:github    这里,我们先进行一些数据分析,这里先说下我的设备,CPU内存128G,GPU GTX1080Ti 11G,但是只是工作站,所以图形显示就有点尴尬了。round1_ijcai_18_train_20180301 :47...

2018-03-16 23:00:18

阅读数:213

评论数:0

数据挖掘的一些统计代码小结

   打比赛一点点的总结经验,看人家代码学习方法,这篇是看o2o的一些统计代码的小结,方便以后打比赛的时候查找代码。最近报名了IJCAI-2018的比赛,关于广告算法。从这里开始先找经验吧,这算是一个真正的打比赛了,希望能取得好成绩。off_train = pd.read_csv('data/cc...

2018-03-09 17:51:25

阅读数:108

评论数:0

天池-盐城上牌

   上次血糖的比赛没有能够进入复赛,有点小遗憾吧,但是毕竟是第一次打比赛,完全萌新,也没什么了,最后146名,继续加油吧,所以报了这个比赛。今天得知将收到天池的订制U盘。很高兴,哈哈,那就开始新的赛程吧。毕竟经验需要一点点的积累,这个又是一个新问题,和时间有关的。反正以我现在经验,遇到的都是新问...

2018-02-05 18:29:12

阅读数:181

评论数:0

特征工程

最近做比赛的一波操作,几乎没有显著效果,虽然在这个比赛没有效果,但是其他比赛可能用的上。先记录一下最近做的特征工程吧。这个可以接着血糖那篇博客。打开血糖预测博客。 1.移除特征中的异常值 # 移除异常值 exclude_unique = [] for c in data.c...

2018-01-27 22:36:28

阅读数:126

评论数:0

sklearn的数据预处理

数据预处理 概要 sklearn是一个比较常用的机器学习库,其中的sklearn.preprocessing包含了常用的预处理函数,一般在kaggle等数据竞赛网站拿到数据的时候,首先要观察数据特征,分布等信息,然后进行数据预处理。数据预处理有利于计算机进行计算。 原始数据存在的...

2018-01-23 00:56:42

阅读数:84

评论数:0

血糖预测回归问题

这篇博客是接上文的,现在就开始做特征工程了,上面都是做的一些模型的融合,cv的验证,既然已经有了这些基础,那么必须要做最重要的部分了,特征工程十分重要,可以说是比赛的最关键步骤。赛题的链接:点击打开链接1.引入相关的库,并读入数据。# coding:utf-8 import pandas as p...

2018-01-16 12:40:37

阅读数:453

评论数:2

kaggle竞赛的小结基于--House Prices: Advanced Regression Techniques(回归类问题)

前天报名了天池的天池精准医疗大赛——人工智能辅助糖尿病遗传风险预测的比赛,今天的提交排名是180多名,但是总排名300+,还没有进行数据工程的工作,所以去kaggle找了这个有相似度的题。下面将我这两天看的一些特征工程方面的代码贴在下面,数据的预处理可以按照这个步骤,其中kaggle的链接kagg...

2018-01-08 15:51:15

阅读数:639

评论数:0

Faster R-CNN系列解读

原理

2017-12-30 13:21:28

阅读数:141

评论数:0

Tensorflow实现Faster RCNN

今天一天将tensorflow下的faster rcnn实现了,运行demo.py并得到成果,从安装到运行。所以记录一下,我用的GPU工作站,GTX1080ti,内存11G。基础的CUDA配置这里就不详述了。由于是实验室的GPU,所以,在自己的目录下用Anaconda2创建自己的环境,其中Anac...

2017-12-28 21:37:44

阅读数:3944

评论数:8

Ubuntu16.04下同时安装Anaconda2与Anaconda3

由于编程时同时需要有python2/3的环境和大量的依赖包,本文的思路是先根据Ubuntu预装的python2.7来安装Anaconda2,然后将Anaconda3作为其环境安装在envs文件夹下。  需要注意的是,鉴于在线安装Anaconda3实在太慢了,本文使用的是离线安装方法。 安装...

2017-12-28 15:41:53

阅读数:750

评论数:0

Faster R-CNN的配置、运行(免费深度学习平台可以使用)

首先感谢一下IBM大神们的无私提供,如果没有深度学习环境的同学们可以申请super vessul,免费的深度学习云平台,具体的百度一下就可以了,感谢一波IBM。而且已经预装好了caffe的框架,这里可以先介绍一下如何在上面运行 Faster R-CNN。 1.先登陆到平台,并启动服务,我有两个服务...

2017-12-21 14:51:38

阅读数:238

评论数:0

利用Inception-v3在kaggle上Digit Recognizer

作为一个kaggle新手,最好的入门还是Digit Recognizer,看了一些其他的kernel,发现基本都是用普通的vggnet实现的,但是效果不是很好,所以想到用迁移学习,将googlenet用来解决问题。 相应的数据请到kaggle官网下载。 1。将train.csv中数...

2017-12-10 10:27:37

阅读数:156

评论数:0

inception-v3迁移学习

接着上一篇文章,我们现在进行inception-v3的迁移学习,用原来的权重参数进行特征提取,在最后的瓶颈中添加一个分类层。 在pool_3后面添加一个input,然后训练这些。其中数据集 #!/usr/bin/env python3 # -*- coding: utf-8 -...

2017-12-07 23:30:08

阅读数:648

评论数:5

简单迁移学习inception-v3各种图像的识别

接着上一篇文章,上一篇文章中,我们下载了

2017-12-06 14:49:26

阅读数:715

评论数:0

下载Inception v-3模行 观察网络模型

下面的代码是下载Incetion v-3的代码: # coding: UTF-8 import tensorflow as tf import os import tarfile import requests # inception模型下载地址 inception_pretrain_mode...

2017-12-05 22:11:26

阅读数:164

评论数:0

读取.tfrecords格式数据集,进行geture的cnn构建、训练、模型保存

接着上一篇手势数据集制作完成后,我们就能够根据数据集,然后模型构建,训练,保存,Board可视化。 代码中写出了相应的注释: # coding: utf-8 # 读取.tfrecords格式数据集,进行geture的cnn构建、训练、模型保存 import tensorflow as tf ...

2017-12-04 21:09:57

阅读数:381

评论数:12

手势识别+tfrecods数据集的制作

实验所需要的环境: tensorflow-0.10 python-opencv Image   ubuntu14.4 本实验的数据集是点击打开链接微云 其中包括9种手势,部分形式见下面的图,如果连接失效,可以向我索要。 单通道的图片,但是写代码的时候差异不大。 文件的存放...

2017-12-04 20:54:18

阅读数:564

评论数:6

style-transfer的实现(tensorflow)

风格转化是一个很流行的app应用,虽然现在过去风头了,但是自己实现一下也是好的。paper需要自己去解读,下面是图解。 中间是一个空白图片或者噪音图片。然后将空白图片和S表示style、C表示content进行最小损失函数,但是这样训练和验证会加大时间,测试太慢。然后使用如下的网络:   ...

2017-11-19 17:13:16

阅读数:497

评论数:0

ML基础---KNN的应用

算法详述      步骤:      为了判断未知实例的类别,以所有已知类别的实例作为参照      选择参数K      计算未知实例与所有已知实例的距离      选择最近K个已知实例      根据少数服从多数的投票法则(majority-voting),让未知实例归类为...

2017-11-18 22:53:27

阅读数:74

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭