自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 pytorch基础: Tensor数据类型与基础函数

pytorch基础: Tensor数据类型与基础函数1. Tensor的数据类型在PyTorch中,主要有10种类型的tensor,其中重点使用的为以下八种(还有BoolTensor和BFloat16Tensor):Data typedtypedtype32-bit floating pointtorch.float32 or torch.floattorch.(cuda).FloatTensor64-bit floating pointtorch.float64 o

2021-11-03 14:36:21 3103

原创 CMU CS:APP3e学习-环境介绍和DataLab

前提说明:我最近一直在学习CSAPP这门课,听两位教授讲课十分过瘾,也产生了一些心得。而在国庆期间无意看到了@anarion 大佬所写的学习笔记,深有感触,同时发现我和他的学习思路和使用工具(jetbrains,vscode,linux)都非常接近,于是也想把自己的心得和作业思路写成文章,分享在知乎上。我是一名普通的本科生,学这些课程只是出于自己的兴趣。我计划将这门课的学习写成一个专栏,以更加深入地理解课程内容,也算是对自己的一个监督。课程介绍这门课程是卡内基梅隆大学的计算机基础课程,内容涵盖了计算机.

2021-11-03 15:13:21 520

原创 高基数类别型特征的处理方案记录

之前在做机器学习课的大作业时,我们组用到了2014年kaggle的点击率预测数据,于是我们特意参考了第二名的一个思路——mean encoding,我在这里把这个方法完整记录下来。该思路的来源是一篇非常古老的2001年KDD论文:A Preprocessing Scheme for High-Cardinality Categorical Attributes in Classification and Prediction Problems高基数类型特征的常见处理方法mean encoding方法

2021-11-03 14:47:54 870

原创 理解训练集和验证集中偏差和方差的关系

基本假设我们假设一个数据集满足y=f(x)+εy=f(x)+\varepsilony=f(x)+ε,取自联合概率密度函数p(x,y)p(x,y)p(x,y)。x为特征,y为标签,ε\varepsilonε是期望为0的随机扰动项,一般可设其满足N(0,1)N(0,1)N(0,1)。偏差和方差我们把该数据集分成K份训练集和一份验证集(交叉验证的方式),用各训练集分别训练得到K个模型,再用这K个模型分别运行验证集(含N个样本),得到K份预测值记为y^ij\hat{y}_{ij}y^​ij​,真实值记为yjy

2021-11-03 14:45:57 736

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除