![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
datawhale打卡
ENTRopYYY
机器不会学习
展开
-
【datawhale】学习小组打卡博客5
比赛链接:零基础入门 CV 赛事 - 街景字符编码识别 打卡任务:模型集成 多模型集成 四种最常用的多模型集成方法 假设共有 N 个模型待集成,对某测试样本xx, 其预测结果为 N 个 C 维向量,(C 为数据的标记空间大小):s1,s2,⋯,sN 直接平均 直接平均不同模型产生的类别置信度得到最后预测结果 加权平均 在直接平均法基础上加入权重 调整不同模型输出的重要程度 wi 作为第 i 个模型的权重,需满足: 高准确率的模型权重较高,低准确率模型可设置稍小权重 投票 多数表决法 (ma原创 2020-06-02 22:35:16 · 252 阅读 · 0 评论 -
【datawhale】学习小组打卡博客4
比赛链接:零基础入门 CV 赛事 - 街景字符编码识别 打卡任务:模型训练与验证 数据集 训练集:用来训练模型内参数的数据集,Classfier 直接根据训练集来调整自身获得更好的分类效果。 验证集:用于在训练过程中检验模型的状态,收敛情况。验证集通常用于调整超参数,根据几组模型验证集上的表现决定哪组超参数拥有最好的性能。同时验证集在训练过程中还可以用来监控模型是否发生过拟合,一般来说验证集表现稳定后,若继续训练,训练集表现还会继续上升,但是验证集会出现不升反降的情况,这样一般就发生了过拟合。所以验证集也原创 2020-05-30 23:15:16 · 128 阅读 · 0 评论 -
【datawhale】学习小组打卡博客3
比赛链接:零基础入门 CV 赛事 - 街景字符编码识别 打卡任务:字符识别模型 模型选择 采用常规分类模型:resnet50、densenet121、EffientNet 这里我选用EfficientNet from efficientnet_pytorch import EfficientNet def net(num_class, model_name, pretrain=True): if name == "efficientnet": model = EfficientNet.from_原创 2020-05-26 22:10:21 · 137 阅读 · 0 评论 -
【datawhale】学习小组打卡博客2
初步分析 利用json文件中的标签信息,将ground truth还原,以便进一步分析数据 def plot_rectangle(root_path, img_list, type): # 新建文件夹,将画出GT的图像另存 if not os.path.exists("data_bb"): os.mkdir("data_bb") if not os.path.exists("data_bb/train_bb") and type == "train": os原创 2020-05-23 22:45:01 · 211 阅读 · 0 评论 -
【datawhale】学习小组打卡博客1
【datawhale】学习小组打卡 比赛链接:零基础入门 CV 赛事 - 街景字符编码识别 打卡任务:赛题理解 赛题数据 赛题来源自 Google 街景图像中的门牌号数据集(The Street View House Numbers Dataset, SVHN),并根据一定方式采样得到比赛数据集。 数据集报名后可见并可下载,该数据来自真实场景的门牌号。训练集数据包括 3W 张照片,验证集数据包括 1W 张照片,每张照片包括颜色图像和对应的编码类别和具体位置;为了保证比赛的公平性,测试集 A 包括 4W 张原创 2020-05-20 17:04:32 · 122 阅读 · 0 评论