qq_44980515-CSDN博客

原创零基础入门CV赛事-Task3 字符识别模型

目录卷积神经网络利用pytorch构建CNN模型卷积神经网络上图中CNN要做的事情是：给定一张图片，是车还是马未知，是什么车也未知，现在需要模型判断这张图片里具体是一个什么东西，总之输出一个结果：如果是车那是什么车最左边是数据输入层，对数据做一些处理，比如去均值（把输入数据各个维度都中心化为0，避免数据过多偏差，影响训练效果）、归一化（把所有的数据都归一到同样的范围）、PCA/白化等等。CNN只对训练集做“去均值”这一步。中间是CONV：卷积计算层，线性乘积求和。RELU：激励层，上文2.

2020-05-26 23:10:04 226 1

原创零基础入门CV之街道字符识别-Task02数据读取与数据扩增

目录数据读取数据扩增数据读取赛方为方便进行数据读取，已经给出JSON中标签的读取方式：import jsontrain_json = json.load(open('../input/train.json'))# 数据标注处理def parse_json(d): arr = np.array([ d['top'], d['height'], d['left'], d['width'], d['label'] ]) arr = arr.astype(in

2020-05-23 22:48:15 225

原创零基础入门CV之街道字符识别-Task01赛题理解

目录一、赛事介绍二、赛题理解（一）赛题数据（二）数据示例（三）字段表三、评测标准四、解题思路（一）抽象为定向字符识别（二）利用CRNN字符识别模型一、赛事介绍本期学习是Datawhale联合天池举报的零基础睡CV赛事，是系列学习（数据挖掘、CV、NLP、机器学习、深度学习、推荐系统）的第二场，本次学习以计算机视觉竞赛项目为实践，将会对数据读取、数据扩增、字符识别模型、模型训练、模型验证及模型集成展开学习。二、赛题理解（一）赛题数据赛题来源自Google街景图像中的门牌号数据集（The Stree

2020-05-20 21:12:42 442 1

原创零基础入门数据挖掘之模型融合

目录一、模型融合概念（一）分类二、Stacking介绍（一）概念（二）过程三、代码示例（一）回归/分类概率-融合1.简单加权平均，结果直接融合2.Stacking融合（回归）（二）分类模型融合1.Voting投票机制2.分类Stacking/Blending融合四、天池赛实例XGB的五折交叉回归验证实现划分数据集，并用方法训练和预测加权融合Stacking融合一、模型融合概念模型融合通常可以在...

2020-04-04 21:59:05 294

原创零基础入门数据挖掘之模型调参

目录内容代码示例内容1.线性回归模型：线性回归对于特征的要求；处理长尾分布；理解线性回归模型；2.模型性能验证：评价函数与目标函数；交叉验证方法；留一验证方法；针对时间序列问题的验证；绘制学习率曲线；绘制验证曲线；3.嵌入式特征选择：Lasso回归；Ridge回归；决策树；4.模型对比：常用线性模型；常用非线性模型；5.模型调参：贪心调参方法；网格调参...

2020-04-01 21:56:17 149

原创机器学习中的特征工程

目录一、特征工程目标二、特征工程内容（一）异常处理（二）特征标准化/归一化（三）数据分桶（四）缺失值处理（五）特征构造（六）特征筛选（特征选择）（七）降维三、代码示例（一）导入数据（二）删除异常值（三）特征构造（四）特征筛选1.过滤式2.包裹式3.嵌入式（五）经验总结一、特征工程目标对于特征进行进一步分析，并对于数据进行处理。完成对于特征工程的分析，并对于数据进行一些图表或者文字总结。二、...

2020-03-28 20:10:03 250

原创 EDA-数据探索性分析

自定义标题EDA简介导入数据总览数据概况对NaN进行可视化方法一 matplotlib 柱状图方法二 missingnoEDA简介探索性数据分析（Exploratory Data Analysis）简称为EDA，是指对已有的数据（特别是调查或观察得来的原始数据）在尽量少的先验假定下进行探索，通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法。EDA的主要工作包括...

2020-03-24 16:37:39 388

原创 TypeError: '>' not supported between instances of 'str' and 'float'

目录含义出现原因情况一纠正措施情况二纠正措施含义类型错误，浮点数和字符串之间无法比较。出现原因出现这种错误类型，目前遇到了两种情况，如下：** 一、对excel的两列数据进行字典键与键值对应操作时，键值列数据既存在浮点数类型又存在字符串类型。**代码展示import xlrdf1 = xlrd.open_workbook('wordcount_test.xlsx')# 获取E...

2020-03-14 09:36:08 25653

原创吴恩达-机器学习作业-ex1 线性回归(中文译本与解析)

吴恩达-机器学习作业-中文译本与解析前言本文章主要用python语言完成斯坦福大学吴恩达机器学习的课程作业。课程作业原先使用的是 Octave 和 MATLAB。不过以目前发展趋势来看，无论是对 Machine Learning 的学习还是对未来工程项目的开发 Python 都更为合适。希望能帮助大家理清课程的内容，理解算法背后的模型，掌握一些 Python 基本库的使用。作业第一章 e...

2020-02-20 14:52:11 850 1

原创机器学习笔记——（一）线性回归

线性回归介绍线性回归又称为最小二乘法回归Ordinary Least-Squares (OLS) Regression。简单来说就是一条线性函数来很好的拟合已知数据并预测未知数据。在回归分析中，只包括一个自变量和一个因变量，且二者的关系可用一条直线近似表示，这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量，且因变量和自变量之间是线性关系，则称为多元线性回归分析。一...

2020-02-14 22:00:40 334

原创软件著作权申请详细流程

软件著作权申请详细流程前言材料准备一、软件著作权登记申请表二、软件鉴别材料(一) 说明表(二) 代码表三、申请人身份证明(一) 若申请人为单位(二) 若申请人为自然人填写说明流程图思维导图常见问题- 软件著作权保护期限是多长？- 游戏可以登记吗？- 算法软件可以登记吗？- 登记证书可以要两个或多个吗？- 软件的1.0已经登记，升级版本还要再登记吗？- 申请登记的软件名称是不是不能与已登记的软件名称...

2020-02-10 11:37:43 951

qq_44980515的博客