- 博客(21)
- 收藏
- 关注
原创 Datawhale AI夏令营【从零入门CV图像竞赛】数据增强,提升模型表现
在上一次实验的基础上,我们注意到模型的性能还有提升空间,同时我们也发现原有的模型(EfficientNet-B4)参数量较小(约77M),未充分利用200M的限制。因此,本次实验我们选择了更大、更强大的模型,以期获得更好的检测效果。
2024-07-17 22:14:49 237
原创 Datawhale AI夏令营【从零入门CV图像竞赛】任务一:了解Deepfake & 初探baseline
随着深度学习技术的快速发展,Deepfake(深度伪造)技术在近年来取得了显著进步,能够生成高度逼真的虚假图像、视频和音频内容。这种技术的进步不仅为创意内容制作带来了新的可能性,同时也对信息真实性、个人隐私和公共安全构成了前所未有的威胁。在这样的背景下,本次挑战赛聚焦于Deepfake检测技术的开发和优化。这个初始版本提供了一个完整的训练流程,包括数据加载、模型训练、验证和保存最佳模型。它采用了一些基本的深度学习最佳实践,如数据增强、学习率调度和模型检查点。感觉要训练很长时间,不知道明天能不能出来。
2024-07-14 18:07:58 528
原创 【云模型部署】任务二:猫狗识别模型
你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。我们对Markdown编辑器进行了一些功能拓展与语法支持,除了标准的Markdown编辑器功能,我们增加了如下几点新功能,帮助你用它写博客:撤销:Ctrl/Command + Z重做:Ctrl/Command + Y加粗:Ctrl/Command + B斜体:Ctrl/Command + I标题:Ctrl/Command + S
2023-11-07 23:18:15 70
原创 【组队学习】06.Pytorch可视化
在深度学习建模过程中,为了能够快速绘制模型基本结构、观察模型评估指标伴随训练过程的动态变化情况,当然也为了能够观察图像数据,我们可以使用TensorBoard工具来进行PyTorch深度学习模型的可视化展示。Tensorboard原本是TensorFlow的可视化工具,而目前在TensorboardX工具的加持下,其他深度学习计算框架也可使用TensorBoard工具进行可视化操作了。...
2022-07-22 21:48:18 715 1
原创 [组队学习]03.PyTorch模型定义
当模型的前向计算为简单串联各个层的计算时,Sequential类可以通过更加简单的方式定义模型。它可以接收一个子模块的有序字典(OrderedDict)或者一系列子模块作为参数来逐一添加Module的实例,⽽模型的前向计算就是将这些实例按添加的顺序逐⼀计算。对应模块为nn.Sequential()。...
2022-07-17 21:25:39 83
原创 Datawhale组队学习numpy第5章排序搜索计数及集合操作
排序,搜索和计数排序numpy.sort(a[, axis=-1, kind='quicksort', order=None]) Return a sorted copy of an array.axis:排序沿数组的(轴)方向,0表示按行,1表示按列,None表示展开来排序,默认为-1,表示沿最后的轴排序。kind:排序的算法,提供了快排’quicksort’、混排’mergesort’、堆排’heapsort’, 默认为‘quicksort’。order:排序的字段名,可指定字段排序,默认
2020-10-31 15:00:56 82
原创 Datawhale组队学习numpy第4章数学函数及逻辑函数
import numpy as npx = np.array([0.0, 10.0, 20.0, 30.0])y = np.array([1.0, 2.0, 3.0])z = x[:, np.newaxis] + yprint(z)# [[ 1. 2. 3.]# [11. 12. 13.]# [21. 22. 23.]# [31. 32. 33.]][[ 1. 2. 3.] [11. 12. 13.] [21. 22. 23.] [31. 32. 33.]]x =
2020-10-28 20:52:10 164
原创 Datawhale组队学习numpy第3章数组的操作-变形
import numpy as npx = np.array([[11, 12, 13, 14, 15], [16, 17, 18, 19, 20], [21, 22, 23, 24, 25], [26, 27, 28, 29, 30], [31, 32, 33, 34, 35]])y = x.flatprint(y)# <numpy.flatiter object at 0x00
2020-10-25 17:13:58 103
原创 Datawhale组队学习numpy第2章索引切片与迭代
import numpy as npx = np.array([[11, 12, 13, 14, 15], [16, 17, 18, 19, 20], [21, 22, 23, 24, 25], [26, 27, 28, 29, 30], [31, 32, 33, 34, 35]])r = np.array([[0, 1], [3, 4]])print(x[r])# [[[11 12 1
2020-10-23 22:23:23 100
原创 Datawhale组队学习numpy第1章数据类型及数组创建
什么是numpy?numpy是python中基于数组对象的科学计算库。 提炼关键字,可以得出numpy以下三大特点: 拥有n维数组对象; 拥有广播功能(后面讲到); 拥有各种科学计算API,任你调用;如何安装numpy?因为numpy是一个python库,所以使用python包管理工具pip或者conda都可以安装。 安装python后,打开cmd命令行,输入:import numpy as npnp.array([1,2,3]) #一维数组array([1, 2, 3])[[0
2020-10-20 22:32:32 183 2
原创 零基础入门金融风控-贷款违约预测作业5
5.1 学习目标将之前建模调参的结果进行模型融合。尝试多种融合方案,提交融合结果并打卡。(模型融合一般用于A榜比赛的尾声和B榜比赛的全程)5.2 内容介绍模型融合是比赛后期上分的重要手段,特别是多人组队学习的比赛中,将不同队友的模型进行融合,可能会收获意想不到的效果哦,往往模型相差越大且模型表现都不错的前提下,模型融合后结果会有大幅提升,以下是模型融合的方式。平均:简单平均法加权平均法投票:简单投票法加权投票法综合:排序融合log融合stacking:构建
2020-09-27 22:20:43 102
原创 零基础入门金融风控-贷款违约预测作业4
4.1 学习目标学习在金融分控领域常用的机器学习模型学习机器学习模型的建模过程与调参流程完成相应学习打卡任务4.2 内容介绍逻辑回归模型:理解逻辑回归模型;逻辑回归模型的应用;逻辑回归的优缺点;树模型:理解树模型;树模型的应用;树模型的优缺点;集成模型基于bagging思想的集成模型随机森林模型基于boosting思想的集成模型XGBoost模型LightGBM模型CatBoost模型模型对比与性能评估:回归模型/树模型
2020-09-24 23:25:12 182
原创 零基础入门金融风控-贷款违约预测作业3
3.1 学习目标学习特征预处理、缺失值、异常值处理、数据分桶等特征处理方法学习特征交互、编码、选择的相应方法完成相应学习打卡任务,两个选做的作业不做强制性要求,供学有余力同学自己探索3.2 内容介绍数据预处理缺失值的填充时间格式处理对象类型特征转换到数值异常值处理基于3segama原则基于箱型图数据分箱固定宽度分箱分位数分箱离散数值型数据分箱连续数值型数据分箱卡方分箱(选做作业)特征交互特征和特征之间组合特征和特征之间衍生其他特征衍生
2020-09-21 20:45:03 255
原创 零基础入门金融风控-贷款违约预测作业2
Task2 数据分析此部分为零基础入门金融风控的 Task2 数据分析部分,带你来了解数据,熟悉数据,为后续的特征工程做准备,欢迎大家后续多多交流。赛题:零基础入门数据挖掘 - 零基础入门金融风控之贷款违约目的:1.EDA价值主要在于熟悉了解整个数据集的基本情况(缺失值,异常值),对数据集进行验证是否可以进行接下来的机器学习或者深度学习建模.2.了解变量间的相互关系、变量与预测值之间的存在关系。3.为特征工程做准备项目地址:https://github.com/datawhal
2020-09-18 21:40:11 300
原创 零基础入门金融风控-贷款违约预测作业1
import numpy as npimport pandas as pdimport osos.chdir("G:\\datawhale\\finance")train = pd.read_csv('train.csv')testA = pd.read_csv('testA.csv')train.head() id loanAmnt term interestRate installment
2020-09-15 22:35:34 176
原创 Datawhale组队学习机器学习算法第二章
Step1: 库函数导入## 基础函数库import numpy as np ## 导入画图库import matplotlib.pyplot as pltimport seaborn as sns## 导入决策树模型函数from sklearn.tree import DecisionTreeClassifierfrom sklearn import treeStep2: 训练模型##Demo演示LogisticRegression分类## 构造数据集x_fearures
2020-08-22 21:59:30 793
原创 Datawhale组队学习机器学习算法第一章
第一部分:Demo实践Step1:函数库导入## 基础函数库import numpy as np ## 导入画图库import matplotlib.pyplot as pltimport seaborn as sns## 导入逻辑回归模型函数from sklearn.linear_model import LogisticRegression##Demo演示LogisticRegression分类## 构造数据集x_fearures = np.array([[-1, -2]
2020-08-17 21:06:00 250
原创 Datawhale组队学习动手学数据分析第一章
1.1载入数据任务1:导入numpy和pandasimport numpy as npimport pandas as pdimport os任务二:载入数据(1) 使用相对路径载入cwd = os.getcwd()os.chdir("D:\datasets\Titanic")df = pd.read_csv('train.csv')df.head() PassengerId Survived Pclass
2020-08-17 16:54:25 757
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人