自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 零基础入门CV赛事-Task3 字符识别模型

目录卷积神经网络利用pytorch构建CNN模型卷积神经网络上图中CNN要做的事情是:给定一张图片,是车还是马未知,是什么车也未知,现在需要模型判断这张图片里具体是一个什么东西,总之输出一个结果:如果是车 那是什么车最左边是数据输入层,对数据做一些处理,比如去均值(把输入数据各个维度都中心化为0,避免数据过多偏差,影响训练效果)、归一化(把所有的数据都归一到同样的范围)、PCA/白化等等。CNN只对训练集做“去均值”这一步。中间是CONV:卷积计算层,线性乘积 求和。RELU:激励层,上文2.

2020-05-26 23:10:04 170 1

原创 零基础入门CV之街道字符识别-Task02数据读取与数据扩增

目录数据读取数据扩增数据读取赛方为方便进行数据读取,已经给出JSON中标签的读取方式:import jsontrain_json = json.load(open('../input/train.json'))# 数据标注处理def parse_json(d): arr = np.array([ d['top'], d['height'], d['left'], d['width'], d['label'] ]) arr = arr.astype(in

2020-05-23 22:48:15 153

原创 零基础入门CV之街道字符识别-Task01赛题理解

目录一、赛事介绍二、赛题理解(一)赛题数据(二)数据示例(三)字段表三、评测标准四、解题思路(一)抽象为定向字符识别(二) 利用CRNN字符识别模型一、赛事介绍本期学习是Datawhale联合天池举报的零基础睡CV赛事,是系列学习(数据挖掘、CV、NLP、机器学习、深度学习、推荐系统)的第二场,本次学习以计算机视觉竞赛项目为实践,将会对数据读取、数据扩增、字符识别模型、模型训练、模型验证及模型集成展开学习。二、赛题理解(一)赛题数据赛题来源自Google街景图像中的门牌号数据集(The Stree

2020-05-20 21:12:42 248 1

原创 零基础入门数据挖掘之模型融合

目录一、模型融合概念(一)分类二、Stacking介绍(一)概念(二)过程三、代码示例(一)回归/分类概率-融合1.简单加权平均,结果直接融合2.Stacking融合(回归)(二)分类模型融合1.Voting投票机制2.分类Stacking/Blending融合四、天池赛实例XGB的五折交叉回归验证实现划分数据集,并用方法训练和预测加权融合Stacking融合一、模型融合概念模型融合通常可以在...

2020-04-04 21:59:05 268

原创 零基础入门数据挖掘之模型调参

目录内容代码示例内容1.线性回归模型:线性回归对于特征的要求;处理长尾分布;理解线性回归模型;2.模型性能验证:评价函数与目标函数;交叉验证方法;留一验证方法;针对时间序列问题的验证;绘制学习率曲线;绘制验证曲线;3.嵌入式特征选择:Lasso回归;Ridge回归;决策树;4.模型对比:常用线性模型;常用非线性模型;5.模型调参:贪心调参方法;网格调参...

2020-04-01 21:56:17 131

原创 机器学习中的特征工程

目录一、特征工程目标二、特征工程内容(一)异常处理(二)特征标准化/归一化(三)数据分桶(四)缺失值处理(五)特征构造(六)特征筛选(特征选择)(七)降维三、代码示例(一)导入数据(二)删除异常值(三)特征构造(四)特征筛选1.过滤式2.包裹式3.嵌入式(五)经验总结一、特征工程目标对于特征进行进一步分析,并对于数据进行处理。完成对于特征工程的分析,并对于数据进行一些图表或者文字总结。二、...

2020-03-28 20:10:03 229

原创 EDA-数据探索性分析

自定义标题EDA简介导入数据总览数据概况对NaN进行可视化方法一 matplotlib 柱状图方法二 missingnoEDA简介探索性数据分析(Exploratory Data Analysis)简称为EDA,是指对已有的数据(特别是调查或观察得来的原始数据)在尽量少的先验假定下进行探索,通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法。EDA的主要工作包括...

2020-03-24 16:37:39 296

原创 TypeError: '>' not supported between instances of 'str' and 'float'

目录含义出现原因情况一纠正措施情况二纠正措施含义类型错误,浮点数和字符串之间无法比较。出现原因出现这种错误类型,目前遇到了两种情况,如下:** 一、对excel的两列数据进行字典键与键值对应操作时,键值列数据既存在浮点数类型又存在字符串类型。**代码展示import xlrdf1 = xlrd.open_workbook('wordcount_test.xlsx')# 获取E...

2020-03-14 09:36:08 24603

原创 吴恩达-机器学习作业-ex1 线性回归(中文译本与解析)

吴恩达-机器学习作业-中文译本与解析前言本文章主要用python语言完成斯坦福大学吴恩达机器学习的课程作业。课程作业原先使用的是 Octave 和 MATLAB。不过以目前发展趋势来看,无论是对 Machine Learning 的学习还是对未来工程项目的开发 Python 都更为合适。希望能帮助大家理清课程的内容,理解算法背后的模型,掌握一些 Python 基本库的使用。作业第一章 e...

2020-02-20 14:52:11 815 1

原创 机器学习笔记——(一)线性回归

线性回归介绍线性回归又称为最小二乘法回归Ordinary Least-Squares (OLS) Regression。简单来说就是一条线性函数来很好的拟合已知数据并预测未知数据。在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。一...

2020-02-14 22:00:40 312

原创 软件著作权申请详细流程

软件著作权申请详细流程前言材料准备一、软件著作权登记申请表二、软件鉴别材料(一) 说明表(二) 代码表三、申请人身份证明(一) 若申请人为单位(二) 若申请人为自然人填写说明流程图思维导图常见问题- 软件著作权保护期限是多长?- 游戏可以登记吗?- 算法软件可以登记吗?- 登记证书可以要两个或多个吗?- 软件的1.0已经登记,升级版本还要再登记吗?- 申请登记的软件名称是不是不能与已登记的软件名称...

2020-02-10 11:37:43 727

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除