DataWhale~follow
文章平均质量分 86
参加datawhale的各种学习活动笔记集中地
小卜妞~
努力精通深度学习、精通机器学习、精通数据科学!
努力精通Java开发、熟练掌握计算机基础!
展开
-
Datawhale~水很深的深度学习~Task 5: 循环神经网络(RNN)
写在前面✍本系列笔记为Datawhale11月组队学习的学习笔记:水很深的深度学习。本次组队学习重理论知识学习,包含DL相关的基础知识,如CNN、RNN、Transformer等。参与本次组队学习两个目的:第一,提起自己DL学习的热情;第二,巩固基础知识,使得做实验更加得心应手。DW 学习文档卷积神经网络本章内容是对于前馈神经网络的总结。前馈神经网络就是目前主流神经网络的基础知识,我们需要从中学习到基本的神经元模型,反向传播算法(多层神经元如何进行学习的),网络的优化等。I 神经元模型II .原创 2021-12-01 22:09:57 · 697 阅读 · 0 评论 -
Datawhale~水很深的深度学习~Task 4: 卷积神经网络(CNN)
写在前面✍本系列笔记为Datawhale11月组队学习的学习笔记:水很深的深度学习。本次组队学习重理论知识学习,包含DL相关的基础知识,如CNN、RNN、Transformer等。参与本次组队学习两个目的:第一,提起自己DL学习的热情;第二,巩固基础知识,使得做实验更加得心应手。DW 学习文档卷积神经网络本章内容是对于前馈神经网络的总结。前馈神经网络就是目前主流神经网络的基础知识,我们需要从中学习到基本的神经元模型,反向传播算法(多层神经元如何进行学习的),网络的优化等。I 神经元模型II .原创 2021-11-27 22:50:22 · 1062 阅读 · 0 评论 -
Datawhale~水很深的深度学习~Task 3: 前馈神经网络
写在前面✍本系列笔记为Datawhale11月组队学习的学习笔记:水很深的深度学习。本次组队学习重理论知识学习,包含DL相关的基础知识,如CNN、RNN、Transformer等。参与本次组队学习两个目的:第一,提起自己DL学习的热情;第二,巩固基础知识,使得做实验更加得心应手。DW 学习文档前馈神经网络本章内容是对于前馈神经网络的总结。前馈神经网络就是目前主流神经网络的基础知识,我们需要从中学习到基本的神经元模型,反向传播算法(多层神经元如何进行学习的),网络的优化等。I 神经元模型II .原创 2021-11-23 22:29:43 · 526 阅读 · 1 评论 -
Datawhale~水很深的深度学习~Task 2: 机器学习基础
写在前面✍本系列笔记为Datawhale11月组队学习的学习笔记:水很深的深度学习。本次组队学习重理论知识学习,包含DL相关的基础知识,如CNN、RNN、Transformer等。参与本次组队学习两个目的:第一,提起自己DL学习的热情;第二,巩固基础知识,使得做实验更加得心应手。误差分析:偏差(bias)反映了模型在 样本上的期望输出与真实 标记之间的差距,即模型本身的精准度,反映的是模型本身的拟合能力。方差(variance)反映了模 型在不同训练数据集下学 得的函数的输出与期望输出之间的误差.原创 2021-11-20 22:48:17 · 2038 阅读 · 0 评论 -
Datawhale~水很深的深度学习~Day1:DL和数学基础
写在前面✍本系列笔记为Datawhale11月组队学习的学习笔记:水很深的深度学习。本次组队学习重理论知识学习,包含DL相关的基础知识,如CNN、RNN、Transformer等。参与本次组队学习两个目的:第一,提起自己DL学习的热情;第二,巩固基础知识,使得做实验更加得心应手。1 绪论绪论部分主要回顾了人工智能、机器学习、深度学习的基本知识,包括概念和分类等。人工智能的发展历程,从符号逻辑推理阶段到人工标注的专家系统阶段,再到现在比较火的数据驱动的深度神经网络阶段,所涉及到的任务包括自然语言处理.原创 2021-11-14 17:04:57 · 776 阅读 · 0 评论 -
FreeExcel Task 01~02 学习+作业
关于Excel:我们平时都会使用Excel进行一些基本的统计操作,本次学习的目的是补充一些没有使用过的工具,增强自己使用Excel的相关技能。本次课程学到了Excel数据的从不同来源导入的方式,数据的类型与转换等。1 数据来源1.1 从文件导入数据Excel支持.txt或.csv文件格式,通过数据-获取和转换数据-从文件/CSV导入数据。1.2 从网站导入选择一个有表格数据的网站,将网站的表格导入到Excel中。...原创 2021-09-11 22:39:33 · 131 阅读 · 1 评论 -
Datawhale~数据挖掘实践之序列问题处理~天池·资金流入流出预测-挑战Baseline~Day06~学习总结
写在前面✍本系列笔记基于天池平台上“资金流入流出预测-挑战Baseline”学习赛,记录如何完整的打一次数据挖掘类比赛。同时,该比赛属于序列建模问题,希望学习完成这个任务,可以对序列问题的处理有一定的独立思考能力和实践操作能力,可以将所学理论,用编码的形式和实际的问题得到深入。第一篇,EDA学习前先提问:Content:初步了解赛题及数据1.1 任务1.2 用户基本信息数据1.3 用户申购赎回数据1.4 收益率表1.5 银行间拆借利率表1.6 提交格式1.7 评分指标ED.原创 2020-08-25 09:23:54 · 207 阅读 · 0 评论 -
Datawhale~数据挖掘实践之序列问题处理~天池·资金流入流出预测-挑战Baseline~Day05~建模预测
写在前面✍建模预测原创 2020-08-25 09:23:39 · 261 阅读 · 0 评论 -
Datawhale~数据挖掘实践之序列问题处理~天池·资金流入流出预测-挑战Baseline~Day04~特征工程
特征工程原创 2020-08-25 09:23:18 · 249 阅读 · 0 评论 -
Datawhale~数据挖掘实践之序列问题处理~天池·资金流入流出预测-挑战Baseline~Day03~时间序列模型
时间序列模型原创 2020-08-22 22:11:34 · 266 阅读 · 0 评论 -
Datawhale~数据挖掘实践之序列问题处理~天池·资金流入流出预测-挑战Baseline~Day02~时间序列规则
时间序列规则原创 2020-08-21 21:23:16 · 424 阅读 · 0 评论 -
Datawhale~数据挖掘实践之序列问题处理~天池·资金流入流出预测-挑战Baseline~Day01~数据探索与分析
写在前面✍本系列笔记基于天池平台上“资金流入流出预测-挑战Baseline”学习赛,记录如何完整的打一次数据挖掘类比赛。同时,该比赛属于序列建模问题,希望学习完成这个任务,可以对序列问题的处理有一定的独立思考能力和实践操作能力,可以将所学理论,用编码的形式和实际的问题得到深入。第一篇,EDAContent:初步了解赛题及数据1.1 任务1.2 用户基本信息数据1.3 用户申购赎回数据1.4 收益率表1.5 银行间拆借利率表1.6 提交格式1.7 评分指标EDA1 初.原创 2020-08-18 22:43:15 · 1791 阅读 · 0 评论 -
Datawhale~Python~Day09~文件与文件系统
1. 文件与文件系统打开文件open(file, mode='r', buffering=None, encoding=None, errors=None, newline=None, closefd=True) Open file and return a stream. Raise OSError upon failure.file: 必需,文件路径(相对或者绝对路径)。mode: 可选,文件打开模式buffering: 设置缓冲encoding: 一般使用utf8errors: 报原创 2020-08-06 22:28:09 · 143 阅读 · 0 评论 -
Datawhale~Python~Day08~模块与datetime模块
模块我觉得这里的术语“模块”,就直接理解成一个包含变量和方法的一个python文件好了。在前面我们脚本是用 Python 解释器来编程,如果你从 Python 解释器退出再进入,那么你定义的所有的方法和变量就都消失了。为此 Python 提供了一个办法,把这些定义存放在文件中,为一些脚本或者交互式的解释器实例使用,这个文件被称为模块(Module)。模块是一个包含所有你定义的函数和变量的文件,其后缀名是.py。模块可以被别的程序引入,以使用该模块中的函数等功能。这也是使用 Python 标准库的原创 2020-08-06 22:27:48 · 187 阅读 · 0 评论 -
Datawhale~Python~Day07~类、对象与魔法方法
类与对象1. 对象 = 属性 + 方法对象是类的实例。换句话说,类主要定义对象的结构,然后我们以类为模板创建对象。类不但包含方法定义,而且还包含所有实例共享的数据。封装:信息隐蔽技术我们可以使用关键字 class 定义 Python 类,关键字后面紧跟类的名称、分号和类的实现。【例子】class Turtle: # Python中的类名约定以大写字母开头 """关于类的一个简单例子""" # 属性 color = 'green' weight = 10原创 2020-08-05 22:40:49 · 155 阅读 · 0 评论 -
Datawhale~Python~Day06~函数与Lambda表达式
https://mp.weixin.qq.com/s/gKhXS8JVU8dZBHJF7sIFsw原创 2020-08-02 23:41:50 · 118 阅读 · 0 评论 -
Datawhale~Python~Day05~字典、集合和序列
前几天的笔记都是直接搬运平台小伙伴提供的参考资料,加上自己的一点点理解和思考,有幸三次都被评为优秀作业。因此,在后续的学习中,我要更认真地学习,多思考,多动手,高效认真的完成作业。最后给出每一次任务的精炼总结,帮助快速复习。本次学习任务是dict,set,序列:在dict部分,序列部分主要是对于list tuple set dict str这些序列操作的讲解,比如说内置函数(min,max,len等),切片以下是详细内容及作业:字典1. 可变类型与不可变类型序列是以连续的整数为索引,.原创 2020-07-31 23:00:27 · 168 阅读 · 0 评论 -
Datawhale~Python~Day04~列表/元组/字符串
列表简单数据类型整型<class 'int'>浮点型<class 'float'>布尔型<class 'bool'>容器数据类型列表<class 'list'>元组<class 'tuple'>字典<class 'dict'>集合<class 'set'>字符串<class 'str'>1. 列表的定义列表是有序集合,没有固定大小,能够保存任意数量任意类型的 Python 对象,语原创 2020-07-26 22:39:36 · 270 阅读 · 0 评论 -
Datawhale~Python~Day03~异常处理
写在前面:非常感谢DataWhale这个平台,感谢大家为我们的付出,整理的资料和答疑解惑!下面借鉴菜鸟教程,补充一些raise和自定义异常的内容异常处理异常就是运行期检测到的错误。计算机语言针对可能出现的错误定义了异常类型,某种错误引发对应的异常时,异常处理程序将被启动,从而恢复程序的正常运行。手动设置异常,捕捉可能的异常,保证程序友好。方便调试!从菜鸟盗过来一张图:1. Python 标准异常总结BaseException:所有异常的 基类Exception:常规异常的 .原创 2020-07-24 21:30:18 · 163 阅读 · 0 评论 -
Datawhale~Python~Day02~条件、循环语句
条件语句1. if 语句if expression: expr_true_suiteif 语句的 expr_true_suite 代码块只有当条件表达式 expression 结果为真时才执行,否则将继续执行紧跟在该代码块后面的语句。单个 if 语句中的 expression 条件表达式可以通过布尔操作符 and,or和not 实现多重条件判断。【例子】if 2 > 1 and not 2 > 3: print('Correct Judgement!')# C原创 2020-07-23 21:36:31 · 195 阅读 · 0 评论 -
Datawhale~Python~Day01~变量、运算符、数据类型、位运算
变量、运算符与数据类型不小心报错组,python基础那么就再复习一遍吧!注释框中是我在原笔记基础上的补充1. 注释在 Python 中,# 表示注释,作用于整行。【例子】单行注释# 这是一个注释''' ''' 或者 """ """ 表示区间注释,在三引号之间的所有内容被注释【例子】多行注释'''这是多行注释,用三个单引号这是多行注释,用三个单引号这是多行注释,用三个单引号'''"""这是多行注释,用三个双引号这是多行注释,用三个双引号 这是多行注释,用三个双引号原创 2020-07-22 20:52:54 · 313 阅读 · 0 评论 -
Datawhale~零基础CV入门~Day05【模型集成】
模型集成本章讲解的知识点包括:集成学习方法、深度学习中的集成学习和结果后处理思路。学习目标:学习目标学习集成学习方法以及交叉验证情况下的模型集成学会使用深度学习模型的集成学习集成学习方法在机器学习中的集成学习可以在一定程度上提高预测精度,常见的集成学习方法有Stacking、Bagging和Boosting,同时这些集成学习方法与具体验证集划分联系紧密。由于深度学习模型一般需要较长的训练周期,如果硬件设备不允许建议选取留出法,如果需要追求精度可以使用交叉验证的方法。下面假设构建了10折交原创 2020-06-02 21:36:13 · 157 阅读 · 1 评论 -
Datawhale~零基础CV入门~Day04【模型训练与验证】
任务:在了解了赛题背景知识、数据集、数据处理、常用模型以及大佬给的baseline之后,现在学习调参训练模型并保存,再用训练好的模型对测试集进行验证。目标:划分数据集,用训练集和验证机进行训练学会pytorch下的模型读取和加载,了解调参流程...原创 2020-05-30 22:39:15 · 254 阅读 · 0 评论 -
Datawhale~零基础CV入门~Day03【字符识别模型】
这一节主要学习CNN模型的基本内容,并且学会使用CNN模型来处理数据class SVHN_Model1(nn.Module): def __init__(self): super(SVHN_Model1, self).__init__() model_conv = models.resnet18(pretrained=True) model_conv.avgpool = nn.AdaptiveAvgPool2d(1)原创 2020-05-27 20:13:38 · 285 阅读 · 0 评论 -
Datawhale~零基础CV入门~Day02【数据读取与数据扩增】
对于baseline的理解:数据读取:数据扩增:为什么要进行数据扩增?pytorch读取数据Datawhale 零基础入门CV赛事-Task2 数据读取与数据扩增在上一章节,我们给大家讲解了赛题的内容和三种不同的解决方案。从本章开始我们将逐渐的学习使用【定长字符识别】思路来构建模型,逐步讲解赛题的解决方案和相应知识点。2 数据读取与数据扩增本章主要内容为数据读取、数据扩增方法和Pytorch读取赛题数据三个部分组成。2.1 学习目标学习Python和Pytorch中图像读取学会扩增方原创 2020-05-23 22:27:57 · 261 阅读 · 0 评论 -
Datawhale~零基础CV入门~Day01 赛题理解
赛题理解:这个赛题是CV入门级赛题,通过街景字符识别来熟悉CV建模思路和竞赛流程。任务:识别图片中的数字评测标准:准确率score=编码识别正确的数量测试集图片数量score = \frac{编码识别正确的数量}{测试集图片数量}score=测试集图片数量编码识别正确的数量结果提交:sample_submit.csv:提交结果需要保证预测结果的格式与其一致,以及提交文件后缀名为csv。file_name, file_code0010000.jpg,4510010001.jpg,232原创 2020-05-18 15:00:28 · 463 阅读 · 0 评论