- 博客(3)
- 收藏
- 关注
原创 数据漂移?训练集测试集分布差异?用featexp解决
数据漂移?训练集测试集分布差异?用featexp解决数据漂移是指由于时间的变动,之前的数据集的分布与现在的数据集的分布不一致,导致之前的模型不能很好的对现在的数据进行预测的情况。简单点说就是随着时间的推移,数据分布变了,基于以前的数据训练好的模型不好用了。目前市面上常用的解决方法:1. 用现在的数据重新训练模型 (这个不需要解释)2. 对抗性验证法论文地址:https://arxiv.org/pdf/2004.03045.pdf这个方法的好处是万一你只有少数当前时间段的数据,不足以用它来重新分割
2021-08-23 00:39:43 1931
原创 poetry项目打包工具详细介绍及演示
Python虚拟环境和依赖管理工具-poetry1. poetry 是什么Poetry 和 Pipenv 类似,是一个 Python 虚拟环境和项目打包工具,比如打包和发布。它可以让你用 Poetry 来同时管理 Python 库和虚拟环境。主页:https://poetry.eustace.io/源码:https://github.com/sdispater/poetry文档:https://poetry.eustace.io/docs2. poetry怎么安装安装poetry的官方命
2021-07-17 16:01:01 2738
原创 语义分割+OCR实现身份证识别
Author: Yu Cheng专业:电子与计算机专业GitHub: https://github.com/yucheng-china文章目录身份证有效区域提取模块文件结构文件说明OCR提取身份证文字信息文件结构文件说明分享一个我自己设计的身份证识别模块,主要分为两个部分:身份证有效区域提取和OCR识别身份证上面的信息。其中有效区域提取指的是从一张随意拍摄的照片中识别身份证区域,然后把那个区域提取出来。最理想状态就是得到一张除了身份证区域没有任何冗余信息的图片。OCR部分是从已经提取到的有效.
2021-03-17 18:32:03 1348 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人