- 博客(4)
- 收藏
- 关注
原创 pytorch基础: Tensor数据类型与基础函数
pytorch基础: Tensor数据类型与基础函数1. Tensor的数据类型在PyTorch中,主要有10种类型的tensor,其中重点使用的为以下八种(还有BoolTensor和BFloat16Tensor):Data typedtypedtype32-bit floating pointtorch.float32 or torch.floattorch.(cuda).FloatTensor64-bit floating pointtorch.float64 o
2021-11-03 14:36:21 3174
原创 CMU CS:APP3e学习-环境介绍和DataLab
前提说明:我最近一直在学习CSAPP这门课,听两位教授讲课十分过瘾,也产生了一些心得。而在国庆期间无意看到了@anarion 大佬所写的学习笔记,深有感触,同时发现我和他的学习思路和使用工具(jetbrains,vscode,linux)都非常接近,于是也想把自己的心得和作业思路写成文章,分享在知乎上。我是一名普通的本科生,学这些课程只是出于自己的兴趣。我计划将这门课的学习写成一个专栏,以更加深入地理解课程内容,也算是对自己的一个监督。课程介绍这门课程是卡内基梅隆大学的计算机基础课程,内容涵盖了计算机.
2021-11-03 15:13:21 554
原创 高基数类别型特征的处理方案记录
之前在做机器学习课的大作业时,我们组用到了2014年kaggle的点击率预测数据,于是我们特意参考了第二名的一个思路——mean encoding,我在这里把这个方法完整记录下来。该思路的来源是一篇非常古老的2001年KDD论文:A Preprocessing Scheme for High-Cardinality Categorical Attributes in Classification and Prediction Problems高基数类型特征的常见处理方法mean encoding方法
2021-11-03 14:47:54 894
原创 理解训练集和验证集中偏差和方差的关系
基本假设我们假设一个数据集满足y=f(x)+εy=f(x)+\varepsilony=f(x)+ε,取自联合概率密度函数p(x,y)p(x,y)p(x,y)。x为特征,y为标签,ε\varepsilonε是期望为0的随机扰动项,一般可设其满足N(0,1)N(0,1)N(0,1)。偏差和方差我们把该数据集分成K份训练集和一份验证集(交叉验证的方式),用各训练集分别训练得到K个模型,再用这K个模型分别运行验证集(含N个样本),得到K份预测值记为y^ij\hat{y}_{ij}y^ij,真实值记为yjy
2021-11-03 14:45:57 758
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人