自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 资源 (11)
  • 收藏
  • 关注

原创 数据预处理之标准化(Z-Score)

概念介绍:将数据按期属性(按列进行)减去其均值,并处以其方差。得到的结果是,对于每个属性/每列来说所有数据都聚集在0附近,方差为1。代码示例:import numpy as npfrom sklearn.preprocessing import MinMaxScaler,StandardScalerdef autoNorm(dataset): x = dataset[:, 0:1]...

2018-04-28 15:47:57 36937 4

原创 数据预处理之归一化(normalization)

概念介绍:归一化是利用特征的最大最小值,将特征的值缩放到[new_min,new_max]区间,对于每一列的特征使用min-max函数进行缩放,计算公式如下代码示例:import numpy as npfrom sklearn.preprocessing import MinMaxScaler,StandardScaler ### Machine LearningActio...

2018-04-28 15:44:35 9180

原创 基于某网站的信息爬取与保存_指定查询内容

需求:对某网站实现输入指定的查询内容后动态爬取并能保存到文本文件中解决方法:通过Python的BeautifulSoup、selenium的Kyes完成该需求。代码见下:import jsonimport urllib.requestimport urllib.errorfrom urllib.parse import quotefrom bs4 import BeautifulSoup...

2018-04-26 09:51:33 1097

原创 基于某网站的信息爬取与保存_指定跳转页

需求:对某网站实现输入指定的跳转页完成爬取并能保存到文本文件中解决方法:通过Python的BeautifulSoup、selenium的Kyes完成该需求。代码见下:import jsonimport urllib.requestimport urllib.errorfrom urllib.parse import quotefrom bs4 import BeautifulSoupfr...

2018-04-26 09:44:34 348

原创 CNN+LSTM+CTC

需求:调研CNN+LSTM+CTC的实现解决方案; 参考github实现示例代码:#!/usr/bin/env python2# -*- coding: utf-8 -*-"""tf CNN+LSTM+CTC 训练识别不定长数字字符图片@author: pengyuanjie"""from com.shenl.ocrTensorflowCnn.genIDCard import *...

2018-04-25 11:29:18 9488 2

原创 读取TFrecord

需求:读取生成的Tfrecord并展示部分图片.解决方法:基于tensorflow、cv2、numpy等库完成该功能.注:改编自网上代码1) 编写读取TFRecord的python代码,见下:import numpy as npimport cv2import tensorflow as tfimport matplotlib.pyplot as pltdef read_and_de...

2018-04-21 14:49:04 782

原创 生成TFrecord

需求:将图片文件保存成Tfrecord的格式.解决方法:基于tensorflow、cv2、numpy等库完成该功能.注:改编自网上代码1) 准备要训练的手写识别的图片文件,并按照目录结构存放。见下图示意: 2) 生成训练图片和标签对应的文本文件,见下图示意: 3) 编写图片生成TFrecord代码,代码见下:import numpy as npimport cv2import ...

2018-04-21 14:45:47 1314

原创 基于某网站的信息爬取与保存

需求:对某网站实现动态爬取并能每天保存到文本文件中解决方法:通过Python的BeautifulSoup、selenium完成该需求。完整代码:import jsonimport urllib.requestimport urllib.errorfrom urllib.parse import quotefrom bs4 import BeautifulSoupfrom builtins...

2018-04-21 13:45:24 579

原创 基于mondrian的多维分析系统

0 术语与约束1) Extraction-Transformation-Loading 是对OLTP数据进行抽取,转换,装载的过程(以下皆简称ETL)2) 文档的说明均按照ETL→DW→CUBE→presentation1 ETL相关1.1维度表1.1.1时间维度1) 说明:该维度记录了每天的时间,粒度最高精确到日,并可分周,月,年等粒度.2) 对应表:tbl_dimdate3) 对应过程: ...

2018-04-21 10:38:10 3360

原创 Kettle使用_5 结合js的数据处理与SetVariable设置动态表输入

需求:熟悉JS脚本在kettle数据处理的应用解决方法:结合Generate Rows(数据生成)和Java Script Value(JS组件)及文本输入组件完成该功能1):拖动一个数据生成组件,并填充数据2):拖动一个Java Script Value(JS组件),补充如下JS代码并获取变量3):拖动一个文本文件输出,选择要输出的目录 4):完成流程示意,此步骤在step2...

2018-04-21 09:52:29 5840 1

原创 Kettle使用_4 Excel批量数据输入

需求:批量导入格式统一的excel文件到表中解决方法:借助Excel输入和正则表达式以及表输入组件完成该功能1)拖个Excel输入组件并按照下图示意操作: 2)拖个表输出组件并按照下图示意操作: 3)完整示意: ...

2018-04-21 09:49:11 3723 1

Excel统计分析.xlsx

此excel是通过内置的数据分析来计算一元线性回归。里面详细描述了参数的计算过程。

2019-10-21

Pro Deep Learning with TensorFlow

本文讨论生成对抗网络,简称GANs。在生成任务或更广泛的无监督学习中,GANs是为数不多在此领域表现较好的机器学习技术之一。特别是他们在图像生成相关任务上拥有出色表现。深度学习领域先驱Yann LeCun,称赞GAN是机器学习近十年来最好的想法

2018-05-17

Python包示例程序

Python包开发示例程序,辅助博库里的包章节

2017-06-19

Oracle SQL调优

Oracle SQL语句优化详解

2014-04-03

PHP和Mysql

This book is a practical, step-by-step PHP and MySQL tutorial that teaches you real-world development practices. Guiding you through every step of the design and build process, this tutorial will teach you how to create high-quality, fully featured, extendable e-commerce web sites.

2013-10-15

cognos8.4安装WIN7版

Win7+Oracle10g+IIS7.5环境下安装Cognos8.4详细步骤说明

2012-08-02

Cognos8.4安装配置指南

Cognos8.4安装配置指南,平台是基于server2003.测试Okay.

2012-08-02

数据中心SQL复制方案

数据中心SQL复制方案,一个介绍SQL SERVER复制功能的演示文档

2010-11-03

SQL Server 2005 Replication Step by Step

SQL Server 2005 Replication Step by Step

2010-11-01

Sql tuning

Sql tuning,o'reilly之sql优化经典之作

2010-02-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除