自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

原创 keras实现文本分类

数据来源自kaggle的一个比赛:data 本文从简单的文本处理模型到深度学习的LSTM模型,逐步的进行讲解。将数据下载下来后,进行数据的导入和预览。 data = pd.read_csv('data/train.csv') data = data.loc[:1000,...

2019-06-14 17:12:40

阅读数 509

评论数 0

原创 jupyter安装详细过程

上班以后时间就不会那么充足了,最近申请了公司的一个服务器,打算挤出点时间继续我的学习之旅。用公司服务器安装jupyter就遇到了问题,所以在这里记录一下,省得以后坑。 1.下载安装anaconda. 到官方网站下载linux版本的.sh。上传到服务器中,这里推荐使用Transmit这款软件,...

2019-04-05 10:35:46

阅读数 197

评论数 0

原创 GridSearchCV 与 RandomizedSearchCV 调参

  好久没写博客了,原因是最近比较忙,一下报了两个比赛,今天终于最后一个比赛的初赛都结束了,抽点小空赶紧总结一下,先汇报下成绩吧。IJCAI2018 阿里妈妈广告算法大赛,初赛第六。FASHIONAI属性识别大赛初赛25 。复赛加油,争取取得更好的成绩。   昨天和前天都加班调参了,但是由于是新手...

2018-04-23 16:13:32

阅读数 8630

评论数 1

原创 IJCAI18 阿里妈妈广告

   比赛的说明,还有比赛的链接IJCAI18   详细代码:github    这里,我们先进行一些数据分析,这里先说下我的设备,CPU内存128G,GPU GTX1080Ti 11G,但是只是工作站,所以图形显示就有点尴尬了。round1_ijcai_18_train_20180301 :47...

2018-03-16 23:00:18

阅读数 803

评论数 1

原创 数据挖掘的一些统计代码小结

打比赛一点点的总结经验,看人家代码学习方法,这篇是看o2o的一些统计代码的小结,方便以后打比赛的时候查找代码。最近报名了IJCAI-2018的比赛,关于广告算法。从这里开始先找经验吧,这算是一个真正的打比赛了,希望能取得好成绩。 off_train = pd.read_csv('da...

2018-03-09 17:51:25

阅读数 936

评论数 1

原创 天池-盐城上牌

   上次血糖的比赛没有能够进入复赛,有点小遗憾吧,但是毕竟是第一次打比赛,完全萌新,也没什么了,最后146名,继续加油吧,所以报了这个比赛。今天得知将收到天池的订制U盘。很高兴,哈哈,那就开始新的赛程吧。毕竟经验需要一点点的积累,这个又是一个新问题,和时间有关的。反正以我现在经验,遇到的都是新问...

2018-02-05 18:29:12

阅读数 509

评论数 2

原创 特征工程

最近做比赛的一波操作,几乎没有显著效果,虽然在这个比赛没有效果,但是其他比赛可能用的上。先记录一下最近做的特征工程吧。这个可以接着血糖那篇博客。打开血糖预测博客。 1.移除特征中的异常值 # 移除异常值 exclude_unique = [] for c in data....

2018-01-27 22:36:28

阅读数 419

评论数 0

原创 sklearn的数据预处理

数据预处理 概要 sklearn是一个比较常用的机器学习库,其中的sklearn.preprocessing包含了常用的预处理函数,一般在kaggle等数据竞赛网站拿到数据的时候,首先要观察数据特征,分布等信息,然后进行数据预处理。数据预处理有利于计算机进行计算。 原始数据存在的...

2018-01-23 00:56:42

阅读数 315

评论数 0

原创 血糖预测回归问题

这篇博客是接上文的,现在就开始做特征工程了,上面都是做的一些模型的融合,cv的验证,既然已经有了这些基础,那么必须要做最重要的部分了,特征工程十分重要,可以说是比赛的最关键步骤。赛题的链接:点击打开链接1.引入相关的库,并读入数据。# coding:utf-8 import pandas as p...

2018-01-16 12:40:37

阅读数 1526

评论数 3

原创 kaggle竞赛的小结基于--House Prices: Advanced Regression Techniques(回归类问题)

前天报名了天池的天池精准医疗大赛——人工智能辅助糖尿病遗传风险预测的比赛,今天的提交排名是180多名,但是总排名300+,还没有进行数据工程的工作,所以去kaggle找了这个有相似度的题。下面将我这两天看的一些特征工程方面的代码贴在下面,数据的预处理可以按照这个步骤,其中kaggle的链接kagg...

2018-01-08 15:51:15

阅读数 2904

评论数 0

原创 Faster R-CNN系列解读

原理

2017-12-30 13:21:28

阅读数 644

评论数 0

原创 Tensorflow实现Faster RCNN

今天一天将tensorflow下的faster rcnn实现了,运行demo.py并得到成果,从安装到运行。所以记录一下,我用的GPU工作站,GTX1080ti,内存11G。基础的CUDA配置这里就不详述了。由于是实验室的GPU,所以,在自己的目录下用Anaconda2创建自己的环境,其中Anac...

2017-12-28 21:37:44

阅读数 31811

评论数 25

原创 Ubuntu16.04下同时安装Anaconda2与Anaconda3

由于编程时同时需要有python2/3的环境和大量的依赖包,本文的思路是先根据Ubuntu预装的python2.7来安装Anaconda2,然后将Anaconda3作为其环境安装在envs文件夹下。  需要注意的是,鉴于在线安装Anaconda3实在太慢了,本文使用的是离线安装方法。 安装...

2017-12-28 15:41:53

阅读数 4979

评论数 0

原创 Faster R-CNN的配置、运行(免费深度学习平台可以使用)

首先感谢一下IBM大神们的无私提供,如果没有深度学习环境的同学们可以申请super vessul,免费的深度学习云平台,具体的百度一下就可以了,感谢一波IBM。而且已经预装好了caffe的框架,这里可以先介绍一下如何在上面运行 Faster R-CNN。 1.先登陆到平台,并启动服务,我有两个服务...

2017-12-21 14:51:38

阅读数 1953

评论数 0

原创 利用Inception-v3在kaggle上Digit Recognizer

作为一个kaggle新手,最好的入门还是Digit Recognizer,看了一些其他的kernel,发现基本都是用普通的vggnet实现的,但是效果不是很好,所以想到用迁移学习,将googlenet用来解决问题。 相应的数据请到kaggle官网下载。 1。将train.csv中数...

2017-12-10 10:27:37

阅读数 409

评论数 0

原创 inception-v3迁移学习

接着上一篇文章,我们现在进行inception-v3的迁移学习,用原来的权重参数进行特征提取,在最后的瓶颈中添加一个分类层。 在pool_3后面添加一个input,然后训练这些。其中数据集 #!/usr/bin/env python3 # -*- coding: utf-8 -...

2017-12-07 23:30:08

阅读数 3723

评论数 5

原创 简单迁移学习inception-v3各种图像的识别

接着上一篇文章,上一篇文章中,我们下载了

2017-12-06 14:49:26

阅读数 6850

评论数 6

原创 下载Inception v-3模行 观察网络模型

下面的代码是下载Incetion v-3的代码: # coding: UTF-8 import tensorflow as tf import os import tarfile import requests # inception模型下载地址 inception_pretrain_mode...

2017-12-05 22:11:26

阅读数 996

评论数 1

原创 读取.tfrecords格式数据集,进行geture的cnn构建、训练、模型保存

接着上一篇手势数据集制作完成后,我们就能够根据数据集,然后模型构建,训练,保存,Board可视化。 代码中写出了相应的注释: # coding: utf-8 # 读取.tfrecords格式数据集,进行geture的cnn构建、训练、模型保存 import tensorflow as tf ...

2017-12-04 21:09:57

阅读数 3352

评论数 22

原创 手势识别+tfrecods数据集的制作

实验所需要的环境: tensorflow-0.10 python-opencv Image   ubuntu14.4 本实验的数据集是点击打开链接微云 其中包括9种手势,部分形式见下面的图,如果连接失效,可以向我索要。 单通道的图片,但是写代码的时候差异不大。 文件的存放...

2017-12-04 20:54:18

阅读数 4103

评论数 11

原创 style-transfer的实现(tensorflow)

风格转化是一个很流行的app应用,虽然现在过去风头了,但是自己实现一下也是好的。paper需要自己去解读,下面是图解。 中间是一个空白图片或者噪音图片。然后将空白图片和S表示style、C表示content进行最小损失函数,但是这样训练和验证会加大时间,测试太慢。然后使用如下的网络:   ...

2017-11-19 17:13:16

阅读数 2636

评论数 4

原创 ML基础---KNN的应用

算法详述      步骤:      为了判断未知实例的类别,以所有已知类别的实例作为参照      选择参数K      计算未知实例与所有已知实例的距离      选择最近K个已知实例      根据少数服从多数的投票法则(majority-voting),让未知实例归类为...

2017-11-18 22:53:27

阅读数 162

评论数 0

原创 ML基础---决策树的应用

1. 什么是决策树/判定树(decision tree)?      判定树是一个类似于流程图的树结构:其中,每个内部结点表示在一个属性上的测试,每个分支代表一个属性输出,而每个树叶结点代表类或类分布。树的最顶层是根结点。当一个属性被使用后就不能再次在下面使用。 如上图所示,当age出现时,下...

2017-11-18 21:50:56

阅读数 1633

评论数 0

原创 wordpress创建自定义后台评论,并且发送邮件

由于客户需要定义一个举报系统,所以我就使用了wordpress自带的评论系统进行修改。是后台能够显示用户想要的字段。后台显示效果如下: 含有填写人的姓名,内容(评论),电话,身份证,地址。当然这些都用js检验。 前台的页面如下所示: 将表单填写完成后,进行提交。然后就能在后台...

2017-09-04 20:42:10

阅读数 1238

评论数 1

原创 wordpress仿站实战教程

有一个月没有写blog了,一直在学习wordpress的知识,现在能够进行简单的政府企业门户网站的仿制,wordpress的主题订制,一般是对前端要求比较高,wordpress学会了,建站还是非常的快的。下面进行教程,没有基础知识的请先看基础知识。 仿站的目标网站:仿站的目标网站,这也是我本科母校...

2017-08-09 21:37:13

阅读数 12186

评论数 2

原创 java爬取国内飞机航班轨迹数据jsoup的探索

接到一个爬虫项目,java编写的调用jsoup。来调取国内民航的轨迹。第一步,先进行根据飞机所属于的航空公司,然后根据改航空公司爬出所有的的航班号。第二步,根据查询出的航班号进行飞行轨迹的的数据爬去。本博客先进行第一阶段的项目代码编写。 所用的网站:http://zh.flightaware.c...

2017-06-29 22:09:55

阅读数 2909

评论数 2

原创 wordpress探索

做为世界上最多使用的开源cms,最大的优势就是入门简单,刚开始本来想进军drupal的,看了两天感觉萌萌的。所以决定先从wordpress开始。wordpress的安装还是比较简单的。下面进行wordpress的安装教程,先copy一个网上教程吧,毕竟我安装完了,大家可以访问我的网站http://...

2017-06-24 23:14:12

阅读数 283

评论数 0

原创 tensorflow进行SVHN数据实验

SVHN is a real-world image dataset for developing machine learning and object recognition algorithms with minimal requirement on data preprocessing a...

2017-06-14 11:23:29

阅读数 2347

评论数 0

原创 tensorflow关于二维码的验证

我使用的环境是tensorflow0.10版本,但是需要安装captcha. 如果出现错误可能会是pillow版本低。需要升级一下pillow的版本。 然后运行如下的代码生成二维码: # -*- coding: utf-8 -*- from captcha.image import Ima...

2017-06-12 17:23:09

阅读数 460

评论数 0

原创 tensorflow的完整的hello world教程(检测自己手写识别数字)

tensorflow作为google开源的项目,现在赶超例caffe,好像成为最受欢迎的深度学习框架。确实在编写的时候更能感受到代码的真实存在,这点和caffe不同,caffe通过编写配置文件进行网络的生成。

2017-06-12 09:02:58

阅读数 4419

评论数 6

原创 Tensorflow进行深度学习(第二)

进行mnist的入门教程

2017-05-31 11:41:21

阅读数 359

评论数 0

原创 Tensorflow进行深度学习(第一)

1.环境的配置:   我的电脑的配置不高,所以不能用Cude进行gpu的加速,选择例cpu版本的。系统为ubuntu14.04,python2.7,theano,keras也全部都安装上,下面进行tensorflow的安装。 $ pip install https://storage.goog...

2017-05-29 10:44:53

阅读数 1395

评论数 1

原创 数据分析和数据可视化(第二讲)-pandas

pandas数据结构: Series 和一维数组一样。 import pandas as pd ser_obj = pd.Series(range(10, 20)) print(ser_obj.index) print(ser_obj.values) 实验运行的结果: RangeIndex(...

2017-04-22 23:10:33

阅读数 232

评论数 0

原创 小型CRM项目(Page分页实现详细教程)

本项目使用SSM框架搭建,前台使用bootstrap框架。 CRM项目外观 1. 开发环境 IDE: Eclipse Mars2  Jdk: 1.7 数据库: MySQL 2. 创建数据库 创建数据库crm,其中

2017-04-21 14:50:18

阅读数 1475

评论数 0

原创 数据分析和数据可视化(第一讲)

第一部分: 这个教程使用的是python进行编写的。大部分代码运行在ipython上面,如果是项目则运行在pycharm的IDE环境下。 那么先进性一些python的入门,这些都是在后面的分析中使用。 1.可变和不可变: 1)大部分的python对象是可变的(mutable)的,e.g.列表、字典...

2017-04-16 23:11:22

阅读数 762

评论数 0

原创 项目实战(二)后台批量插入数据库,前台进度条显示进度

本功能后台通过List批量插入数据库,前台通过ajax调用,动态显示进度条。 先上传运行截图页面很丑陋,没美工。嵌套bootstrap的进度条。 前台代码: 点击button按钮,进行后台的数据库批量上传 导入 进度条--> 正...

2017-04-12 11:11:52

阅读数 11401

评论数 7

原创 Ajax学习和JSON

AJAX使用的是老的技术,新的思想.完成了RIA的应用:Rich Internet Application. * 传统方式的开发:所有的数据提交到服务器端进行处理.(胖服务器) * AJAX的方式开发:有一部分的代码写在客户端. Ø AJAX的作用: 完成页面局部刷新而不影响用户的体验. *...

2017-04-09 21:12:40

阅读数 1819

评论数 0

原创 简单crm的项目实现(第一天)

1.先进行数据库的创建 创建crm数据库 /* Navicat MySQL Data Transfer Source Server : localhost_3306 Source Server Version : 50611 Source Host : l...

2017-03-31 20:13:09

阅读数 447

评论数 0

原创 webservice(第三天)(包含一个真实项目,读取EXCEL表格中的数据到数据库中,其中涉及真实的隐私数据不能公开数据集)

主要内容: CXF的介绍、安装和配置 CXF发布SOAP协议的服务 CXF+Spring整合发布SOAP的服务 CXF发布REST服务 什么是REST CXF+Spring整合发布REST服务 综合案例

2017-03-19 22:09:26

阅读数 1587

评论数 0

原创 webservice(第二天)

Webservice的四种客户端调用方式 公网服务地址: http://www.webxml.com.cn/zh_cn/index.aspx 第一种:生成客户端调用方式 Wsimport命令介绍  Wsimport就是jdk提供的的一个工具,他作用就是根据WSDL地址生成客户端代码  Wsi...

2017-03-18 19:57:07

阅读数 284

评论数 0

提示
确定要删除当前文章?
取消 删除