自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 【学习打卡】Pandas学习第十章:综合练习

综合练习端午节的淘宝粽子交易问题端午节的淘宝粽子交易问题(1)请删除最后一列为缺失值的行,并求所有在杭州发货的商品单价均值。(2)商品标题带有“嘉兴”但发货地却不在嘉兴的商品有多少条记录?(3)请按照分位数将价格分为“高、较高、中、较低、低”5个类别,再将类别结果插入到标题一列之后,最后对类别列进行降序排序。(4)付款人数一栏有缺失值吗?若有则请利用上一问的分类结果对这些缺失值进行合理估计并填充。(5)请将数据后四列合并为如下格式的Series:商品发货地为xx,店铺为xx,共计x×人付款,单

2020-07-01 23:35:41 222

原创 【学习打卡】Pandas第九章:时序数据

Pandas学习第九章:时序数据练习:问题练习:【练习一】 现有一份关于某超市牛奶销售额的时间序列数据,请完成下列问题:df = pd.read_csv('data/time_series_one.csv', parse_dates=['日期'])df.head()(a)销售额出现最大值的是星期几?(提示:利用dayofweek函数)df['日期'].dt.dayofweek[df['销售额'].idxmax()](b)计算除去春节、国庆、五一节假日的月度销售总额holiday = pd

2020-06-29 22:15:30 161

原创 【学习打卡】Pandas第八章:分类数据

Pandas第八章:分类数据一、category的创建及其性质1.分类变量的创建2.分类变量的结构3.类别的修改二、分类变量的排序1.序的建立2.排序三、分类变量的比较操作四、练习一、category的创建及其性质1.分类变量的创建可以用Series创建、对DataFrame指定类型创建、利用内置Categorical类型创建、利用cut函数创建。2.分类变量的结构一个分类变量包括三个部分,元素值(values)、分类类别(categories)、是否有序(order)describe方法:描

2020-06-27 22:42:28 174

原创 【学习打卡】第七章:文本数据

Pandas学习-第七章 文本数据一、string类型的性质1.string与object的区别2.string类型的转换二、拆分与拼接1.str.split方法2.str.cat方法三、替换1.str.replace的常见用法2.子组与函数替换3.关于str.replace的注意事项四、子串匹配与提取1.str.extract方法2.str.extractall方法3.str.contains和str.match五、常用字符串方法1.过滤型方法2.isnumeric方法六、练习一、string类型的性质

2020-06-26 23:07:52 202

原创 【学习打卡】Pandas第六章:缺失数据

Pandas学习-第六章 缺失数据一、缺失观测及其类型1.了解缺失信息a. isna和notna方法-判断缺失值(b) 查看缺失值的所在行(c) 挑出所有非缺失值列2.三种缺失符号二、缺失数据的运算与分组1.加号与乘号规则2.groupby方法中的缺失值三、填充和剔除1.fillna方法(a) 值填充与前后向填充(分别与ffill方法和bfill方法等价)(b)填充中的对齐特性2. dropna方法(a)axis参数(b)how参数(可以选all或者any,表示全为缺失去除和存在缺失去除)(c)subset

2020-06-23 23:37:24 441

原创 【学习记录-街景字符识别】TASK5:模型集成

街景字符识别-模型集成1.集成学习方法2.深度学习中的集成学习2.1 Dropout2.2 TTA2.3 Snapshot3.结果后处理4.小结1.集成学习方法为了提高模型精度,可以采用集成学习方法。集成学习就是通过构建并结合多个学习器来完成学习任务,有时也被称为多分类器系统、基于委员会的学习等。常可获得比单一学习器显著优越的泛化性能,这对“弱学习器”尤为明显。常见的集成学习方法有:Stacking,Bagging,Boosting,这些集成学习方法与具体验证集划分联系紧密。验证集的划分上一次已

2020-06-02 22:58:27 175

原创 【学习记录-街景字符识别】TASK4:模型训练与验证

街景字符识别-模型训练与验证1.构造验证集2.模型训练与验证3.模型保存与加载4.模型调参5.小结一个成熟合格的深度学习训练流程至少具备以下功能:1.在训练集上进行训练,并在验证集上进行验证;2.模型可以保存最优的权重,并读取权重;3.记录下训练集和验证集的精度,便于调参。接下来我将从以下几个方面学习训练流程。1.构造验证集为了防止由于模型复杂度太高引发过拟合问题,我们需要构建一个与测试集分布尽可能一致的样本集(可称为验证集),在训练过程中不断验证模型在验证集上的精度,以此来控制模型的训练。

2020-05-30 16:48:17 212

原创 【学习记录-街景字符识别】TASK3:字符识别模型

街景字符识别-字符识别模型1.CNN基础和原理1.1 CNN介绍1.2 CNN 发展2.Pytorch构建CNN模型本文的任务是构建一个定长字符识别模型。1.CNN基础和原理1.1 CNN介绍全连接神经网络的缺点:1.图像变大导致色彩数变多,不好解决;2.不便处理高维度数据。基于全连接神经网络的缺点,卷积神经网络应运而生。卷积神经网络(简称CNN)是一类特殊的人工神经网络,是深度学习中重要的一个分支,在很多领域都表现优异,精度和速度比传统计算学习算法高很多,特别是在计算机视觉领域,是解

2020-05-26 17:19:27 275

原创 【学习记录-街景字符识别】TASK 2:数据读取与数据扩增

街景字符识别-数据读取与数据扩增1.图像读取1.1 Pillow1.2 OpenCV2.数据扩增3.pytorch读取数据4.小结本文是在用定长字符识别的思路前提下对图像读取和数据扩增进行学习。1.图像读取本赛题数据为图像数据,因此采用的库需要完成对图像的读取,常见的有Pillow和OpenCV。1.1 PillowPillow是Python图像处理函数库(PIL)的一个分支,提供常见的图像读取和处理的操作,可以与notebook无缝集成,是应用比较广泛的库。from PIL import Im

2020-05-23 18:59:00 265

原创 【学习记录-街景字符识别】TASK 1:赛题理解

街景字符识别-赛题理解1.赛题任务2.赛题数据3.数据标签4.评测指标5.读取数据6.解题思路7.本章小结本文内容将对街景字符识别赛题的理解做相应记录,同时作为一个CV初学者,我也想借此练习一下撰写博客的能力,感谢批评指正。1.赛题任务本题以计算机视觉中字符识别为背景,要预测街道字符编码,采用SVHN数据集做一个简单的字符识别问题。2.赛题数据赛题用的是比赛给定的SVHN街道字符数据集,已进行匿名采样。训练集数据包括3W张照片,验证集数据包括1W张照片,每张照片包括颜色图像和对应的编码类别和具体位

2020-05-20 16:02:02 321 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除