自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 数据挖掘-Task3 特征工程

常见的特征工程包括:异常处理:通过箱线图(或 3-Sigma)分析删除异常值;BOX-COX 转换(处理有偏分布);长尾截断;特征归一化/标准化:# 训练集和测试集放在一起,方便构造特征Train_data['train']=1Test_data['train']=0data = pd.concat([Train_data, Test_data], ignore_in...

2020-03-28 23:00:09 157

原创 leetcode914卡牌分组python

class Solution: def hasGroupsSizeX(self, deck: List[int]) -> bool: num=collections.Counter(deck).values() return reduce(gcd, num) >= 2python容器学习Counter 对象正则表达式 re.findal...

2020-03-27 23:42:24 150

原创 天池比赛打卡1 数据分析

2.1 EDA目标EDA的价值主要在于熟悉数据集,了解数据集,对数据集进行验证来确定所获得数据集可以用于接下来的机器学习或者深度学习使用。当了解了数据集之后我们下一步就是要去了解变量间的相互关系以及变量与预测值之间的存在关系。引导数据科学从业者进行数据处理以及特征工程的步骤,使数据集的结构和特征集让接下来的预测问题更加可靠。完成对于数据的探索性分析,并对于数据进行一些图表或者文字总结并打卡...

2020-03-24 21:56:18 247

原创 AI06:批量归一化和残差网络;凸优化;梯度下降

批量归一化和残差网络

2020-02-25 21:53:36 211

原创 AI05:卷积神经网络基础;leNet;卷积神经网络进阶

卷积神经网络基础卷积层和池化层,填充、步幅、输入通道和输出通道。二维卷积层本节介绍最常见的二维卷积层,常用于处理图像数据二维互相关运算二维互相关(cross-correlation)运算的输入是一个二维输入数组和一个二维核(kernel)数组,输出也是一个二维数组,其中核数组通常称为卷积核或过滤器(filter)。卷积核的尺寸通常小于输入数组,卷积核在输入数组上滑动import to...

2020-02-25 20:07:37 211

原创 AI02文本预处理;语言模型;循环神经网络

文本预处理读入文本分词建立字典,将每个词映射到一个唯一的索引(index)将文本从词的序列转换为索引的序列或者用spaCy和NLTK现成的分词工具对文本进行分词语言模型时序数据的采样随机采样:每次从数据里随机采样一个小批量,在随机采样中,每个样本是原始序列上任意截取的一段序列,相邻的两个随机小批量在原始序列上的位置不一定相毗邻。相邻采样:在相邻采样中,相邻的两个随机小批量在原始序...

2020-02-20 11:54:21 106

原创 《动手学深度学习》1 概念性+预备知识

机器学习研究如何使计算机系统利用经验改善性能。它是人工智能领域的分支,也是实现人工智能的一种手段。作为机器学习的一类,表征学习关注如何自动找出表示数据的合适方式。深度学习是具有多级表示的表征学习方法。它可以逐级表示越来越抽象的概念或模式。...

2020-02-20 11:51:37 197

原创 AI03过拟合欠拟合;梯度消失、梯度爆炸;循环神经网络进阶

Task03:过拟合欠拟合及其解决方案训练误差和泛化误差训练误差:模型在训练数据集上表现出的误差泛化误差:模型在任意一个测试数据样本上表现出的误差的期望,并常常通过测试数据集上的误差来近似。机器学习模型应关注降低泛化误差。模型选择验证数据集预留一部分在训练数据集和测试数据集以外的数据来进行模型选择。这部分数据被称为验证数据集,简称验证集(validation set)。例如,我们可...

2020-02-19 21:56:33 265

原创 AI01线性回归;Softmax与分类模型;多层感知机

Task0线性回归模型:线性回归的假设:输出与各个输入之间是线性关系,求出最终的权重与偏置损失函数:在训练过程中衡量价格预测值与真实值间的误差,单个样本时,使用平方误差;取小批量样本时,使用平方误差求平均。优化:使用随机梯度下降,小批量随机梯度下降指先选取一组模型参数的初始值,如随机选取;接下来对参数进行多次迭代,使每次迭代都可能降低损失函数的值。矢量计算:使用torch做矢量加法比使用...

2020-02-14 21:55:31 164

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除