自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

屏幕里的日与夜

思考笔记,个人记事本。

  • 博客(31)
  • 收藏
  • 关注

原创 论文笔记 AAAI2020 Multi-View Partial Multi-label Learning with Graph-based Disambiguation

论文笔记 论文阅读背景介绍提出的方法Candidate Labels DisambiguationDisambiguation-Guided Model Induction实验最近看到了这篇文章,觉得可以拿来参考,先做个阅读笔记记录一下。论文阅读先附上论文地址背景介绍这篇文章研究的问题是在多视图多标签学习(MVML)学习中标签不可信的问题。在常规的MVML研究中,通常假定针对每个训练实例都已对所有相关标签进行了精确注释。但是,在许多现实世界的场景中,通常很难获得精确的注释,而且成本很高。所以文

2020-08-06 16:26:37 1121

原创 LeetCode每日一题8月记录

LeetCode每日一题8月记录8.1 最小区间8.1 最小区间原题地址.变相的用滑动窗口法求解,统计每个数字出现在输入的哪几个数组里面,然后利用双指针滑动窗口寻找最小的左右边界,使得全部数组都有这些元素。class Solution: def smallestRange(self, nums: List[List[int]]) -> List[int]: n = len(nums) indices = collections.defaultdict(l

2020-08-01 09:26:19 891

原创 GBDT、Xgb、Lgb对比以及常见面试题

GBDT、Xgb、Lgb对比以及常见面试题GBDT特点正则化Xgb特点正则化Lgb常见面试题RF与GBDT之间的区别Xgb与GBDT的区别Lgb与Xgb的区别之前写了一点RF的东西,作为决策树+bagging的模型自然经常会被拉出来和决策树+boosting的模型进行对比;而GBDT、Xgb、Lgb一系列的产物正式这种思路加上一些改进的工程产物,所以就一起放出来对比说明了。GBDT特点GBDT 是梯度提升树(Gradient Boosting Decison Tree)的简称,GBDT 通过多轮迭代

2020-07-16 22:13:33 4722

原创 RF详解以及常见面试题

学习RF的心得体会以及搜集的一些面试题RF数据集随机节点特征随机RF相关面试题随机森林与SVM的比较RF抗过拟合强的原因RF和GBDT的区别RF之前说过了决策树,试想一下如果有很多千姿百态的决策树组成了一个森林,那么以每个树的预测结果投票得到最后的模型输出的话,是不是能得到一个更加鲁棒,抗过拟合能力比较好的模型了。回顾一下决策树生成的过程,重复对一个数据集生成决策树的话,树形是确定的,也就是说每次生成的树是一样的,这样的话就达不到生成千姿百态的决策树再组成森林的目的了;同样的决策树组成森林结果是不变的

2020-07-14 21:13:31 1858

原创 AAAI2020多视图学习模型MvNNcor对多标签任务迁移

AAAI2020多视图学习模型MvNNcor对多标签任务迁移的一些思路想法

2020-07-13 20:17:26 458

原创 论文笔记 AAAI2020 Deep Embedded Complementary and Interactive Information for Multi-view Classification

AAAI2020的多视图学习论文 Deep Embedded Complementary and Interactive Information for Multi-view Classification的阅读笔记以及代码复现

2020-07-07 20:01:18 1356 1

原创 PyTorch的nn.LSTM使用说明

PyTorch的nn包下面自带很多经典的模型,我们可以快速的引入一个预训练好了的模型用来处理我们的任务,也可以单纯的添加一个这种架构的空白网络称为我们模型的子结构。其中LSTM是使用的相当多的一个,本文介绍nn.LSTM的一些使用情况。

2020-07-03 20:50:17 16482 1

原创 注意力机制以及应用

注意力机制以及应用注意力机制的由来二级目录三级目录Attention成为了越来越来模型里绕不过去的坎,好像不过怎么样都加一个,那么注意力机制到底是什么以及计算流程和具体应用有哪些呢,今天来简单罗列一下。注意力机制的由来可以粗略地把注意力机制类比成一个可以专注于输入内容的某一子集(或特征)的神经网络,着力于占比不大但是格外重要的部分。二级目录三级目录...

2020-07-01 21:17:37 2763

原创 LeetCode每日一题7月记录

LeetCode每日一题7月记录7.1最长重复子数组7.1最长重复子数组原题地址.A[i:]和B[j:]的最长重复长度为A[i+1:]和B[j+1:]最长长度加1(如果A[i]==B[j]),所以可以用动态规划思想解决。class Solution: def findLength(self, A: List[int], B: List[int]) -> int: n = len(A) m = len(B) dp = [[0] * (m+1

2020-07-01 08:46:38 945

原创 Pytorch学习笔记-第十章

Pytorch学习笔记-第十章图像描述data_preprocessdatafeature_extractmodelmain记录一下个人学习和使用Pytorch中的一些问题。强烈推荐 《深度学习框架PyTorch:入门与实战》.写的非常好而且作者也十分用心,大家都可以看一看,本文为学习第十章图像描述的学习笔记。主要分析实现代码里面main,data,data_preprocess,feature_extract这5个文件完成整个项目模型结构定义,训练及生成,还有输出展示的整个过程。data_prepr

2020-06-29 19:46:24 357

原创 Pytorch学习笔记-第九章

Pytorch学习笔记-第九章RNN诗人utilsdatamodelmainTrain前缀诗生成藏头诗生成记录一下个人学习和使用Pytorch中的一些问题。强烈推荐 《深度学习框架PyTorch:入门与实战》.写的非常好而且作者也十分用心,大家都可以看一看,本文为学习第九章RNN诗人的学习笔记。主要分析实现代码里面main,data,model,utils这4个代码文件完成整个项目模型结构定义,训练及生成,还有输出展示的整个过程。utils这个文件没啥好说的了,就是封装了一个visdom对象,再多加

2020-06-28 21:43:40 950

原创 LeetCode卡片探索-中级算法

卡片探索-中级算法数组和字符串三数之和矩阵置零字母异位词分组无重复字符的最长子串最长回文子串递增的三元子序列链表树和图回溯算法排序和搜索动态规划设计问题数学其他LeetCode上知识卡片之中级算法的刷题记录数组和字符串三数之和把数组排序后,遍历数组,每次固定当前元素,然后用双指针再后续数组里面搜索与它相加为0的元素组合。class Solution: def threeSum(self, nums: List[int]) -> List[List[int]]: n=l

2020-06-28 09:54:41 1253

原创 连续值特征分桶区间设置

连续值特征分桶区间设置依靠实际意义依靠数学分析oddsWOEIV值等宽等频K-means卡方统计我们实际遇到的数据经常会是连续取值的数据,比如一些表示计数或者量级的属性。有些模型比如常用的梯度提升树系列(GBDT,XGB,LGB)可以不做任何处理的直接输入;也有些模型(lr,nn)把数值属性去除量纲后就可以作为输入;但是一般为了方便处理或者提取出更有用的信息我们会做分桶或者说分箱处理。设置几个阈值把总的取值区间划分为几个小区间,每个样本的取值就会落在其中一个区间,如果阈值设置的好的话相当于人工

2020-06-27 22:50:21 2050

原创 Pytorch学习笔记-第八章

Pytorch学习笔记-第八章风格迁移utilsGram矩阵PackerVGGtransformermain训练生成图片记录一下个人学习和使用Pytorch中的一些问题。强烈推荐 《深度学习框架PyTorch:入门与实战》.写的非常好而且作者也十分用心,大家都可以看一看,本文为学习第八章风格迁移的学习笔记。主要分析实现代码里面main,transformer,PackedVGG,utils这4个代码文件完成整个项目模型结构定义,训练及生成,还有输出展示的整个过程。utils这是项目中用到的一些额外工

2020-06-27 18:35:52 622

原创 Pytorch学习笔记-第七章

Pytorch学习笔记-第七章GAN生成动漫头像model文件生成器判别器visualize文件main文件数据处理训练判别器生成器生成结果记录一下个人学习和使用Pytorch中的一些问题。强烈推荐 《深度学习框架PyTorch:入门与实战》.写的非常好而且作者也十分用心,大家都可以看一看,本文为学习第七章GAN生成动漫头像的学习笔记。主要分析实现代码里面main,model,visualize这3个代码文件完成整个项目模型结构定义,训练及生成,还有输出展示的整个过程。model文件整个模型结构是经

2020-06-26 16:59:22 387

原创 Pytorch学习笔记-第六章

Pytorch学习笔记-第六章猫狗大战记录一下个人学习和使用Pytorch中的一些问题。强烈推荐 《深度学习框架PyTorch:入门与实战》.写的非常好而且作者也十分用心,大家都可以看一看,本文记录按照该书学习Pytorch时在第六章猫狗大战遇到的一些问题。...

2020-06-16 19:36:26 248

原创 从经典到深度学习的数据补全

数据补全方法MissForestGAINMissForestGAIN

2020-06-15 21:42:27 7234 2

原创 py和ipynb文件互相转化

py和ipynb文件互相转化ipynb转pypy转ipynb越来越多使用python人投入了jupyter notebook的怀抱,比如我哈哈。单元型运行,随时保存输出中间变量结果,方便的输出展示尤其是绘图,以及一堆扩展插件让人感受这份友好;但也不免有些小问题,notebook产生的ipynb怎么变成py文件,而正常的py文件怎么转移到notebook里运行呢。ipynb转py1.首先进入想要转换的ipynb文件所在目录,然后输入如下指令jupyter nbconvert --to script fi

2020-06-14 23:14:10 19446

原创 数据降维以及相关面试题

数据降维以及相关面试题降维PCA方差最大化重构损失最小求解过程投影后数据的一些性质细节LDA原理推导核化处理降维所谓的降维就是指采用某种映射方法,将原高维空间中的数据点映射到低维度的空间中。那么为什么我们需要对数据降维?数据维度太高,样本量稀疏,给机器学习算法带来巨大的时间性能花费。有些特征之间存在相关关系,增加了分析难度,所以用更少数量的不相关的特征代替。接下来介绍一下常用降维方法。PCA如果我们要把原数据投影到一个低维空间,怎么衡量我们投影后的数据好坏呢?我们要认识到数据的方差代表着

2020-06-14 20:50:50 959

原创 Pytorch学习笔记-第五章

Pytorch学习笔记-第五章常用模块数据处理视觉工具包torchvisionImageFolderDataLoader多进程Sample可视化工具TensorboardVisdomGPU加速cuda损失函数使用建议并行化固化数据一般Tensormodle和Optimizer记录一下个人学习和使用Pytorch中的一些问题。强烈推荐 《深度学习框架PyTorch:入门与实战》.写的非常好而且作者也十分用心,大家都可以看一看,本文记录按照该书学习Pytorch时在第五章常用模块遇到的一些问题。数据处理数

2020-06-14 15:25:24 451

原创 LeetCode卡片探索-初级算法

卡片探索-初级算法数组删除排序数组中的重复项买卖股票的最佳时机 II字符串链表树排序和搜索动态规划设计问题数学其他LeetCode上知识卡片之初级算法的刷题记录数组删除排序数组中的重复项难点在于原地删除的同时不想时间复杂度太高的话,可以考虑双指针。一个指针遍历数组判断是否为重复元素,一个指针用来搜集不重复元素并把他们安排到数组前列。class Solution: def removeDuplicates(self, nums: List[int]) -> int: i

2020-06-14 10:04:30 1068

原创 Pytorch学习笔记-第四章

Pytorch学习笔记-第四章nn模块第四章nn注意事项全连接层多层子module卷积层池化层BN层dropout激活函数序列化网络RNNembedding层损失函数优化器nn.functional初始化策略深入理解nn.Module复杂网络中的嵌套复杂网络中的dropout钩子函数模型保存GPU运行nn与autograd的关系记录一下个人学习和使用Pytorch中的一些问题。强烈推荐 《深度学习框架PyTorch:入门与实战》.写的非常好而且作者也十分用心,大家都可以看一看,本文记录按照该书学习Pyto

2020-06-13 17:05:33 923

原创 模型融合Stacking和Blending

模型融合BlendingStacking区别各种比赛中常常见到在特征工程和调参取不到太大的进步的时候,转而进行模型融合操作。常用方法用Stcaking和Blending,该文记录一下学习使用中的情况。Blending数据划分为不相交的部分,一部分用来训练不同的 Base Model,将它们对另外部分的数据输出取(加权)平均。实现简单,但对训练数据利用少了。可以通过对输出组合成一份数据,在其上训练一个LR模型。要求个别单模型效果要好而且模型之间有差异。Stackingstacking可以看作是复杂

2020-06-12 22:15:17 287

原创 Pytorch学习笔记-第三章

Pytorch学习笔记-第三章Tensor和AutogradTensor创建size调整索引高级索引Tensor类型逐元素操作归并操作比较线性代数操作numpy和tensor广播内部结构向量化Autograd反向传播计算图扩展autograd记录一下个人学习和使用Pytorch中的一些问题。强烈推荐 《深度学习框架PyTorch:入门与实战》.写的非常好而且作者也十分用心,大家都可以看一看,本文记录按照该书学习Pytorch时在第三章Tensor和Autograd遇到的一些问题。Tensor对tens

2020-06-12 22:14:30 705

原创 Pytorch学习笔记-第二章

Pytorch学习笔记第二章快速入门第三章tensor和autograd第四章nn模块第五章相关工具记录一下个人学习和使用Pytorch中的一些问题。强烈推荐 《深度学习框架PyTorch:入门与实战》.写的非常好而且作者也十分用心,大家都可以看一看,本文记录按照该书学习Pytorch时遇到的一些问题。第二章快速入门第三章tensor和autograd第四章nn模块第五章相关工具...

2020-06-12 10:46:30 198

原创 Pandas处理数据的一些常用技巧

利用Pandas处理数据时遇到的一些常见文件以及处理方法

2020-06-07 17:33:44 535

原创 LeetCode每日一题6月记录

LeetCode每日一题6月记录6.1 拥有最多糖果的孩子6.2 求1+2+3......+n之和6.3 新21点6.4 除自身以外数组的乘积6.5 螺旋打印矩阵6.1 拥有最多糖果的孩子原题链接.找出原糖果数里最大的,随后遍历数组,判断元素加上候选糖果之后是否大于原来的最大值。6.2 求1+2+3…+n之和原题链接.首先考虑递归或者迭代方法的话都要考虑一下终止条件问题。利用逻辑操作里面的短路操作n > 1 and self.sumNums(n - 1)如果n是1就不会调用下一个n

2020-06-05 15:58:05 570

原创 机器学习可解释性

机器学习可解释性模型无关方法PDPALESHAPLEY值基于样本的方法关于机器学习可解释性方面的研究,国内有位大佬做了一份很好的总结。Interpretable Machine Learning.同时国内也有人翻译了中文版 可解释的机器学习_中文版,不过大家条件允许的话还是先看原文把。想要了解可解释性的详细概念以及具体一些方法的推导和说明的话可以直接看书,本文仅记录使用这些方法的一些情况。模型无关方法LR和决策树之类的模型是很好解释的,看LR对应特征的参数以及决策树的划分属性都容易被人们理解;

2020-06-03 22:23:12 1031

原创 决策树详解以及常见面试题

学习决策树的心得体会以及搜集的一些面试题决策树训练过程最优划分属性连续和缺失值剪枝操作预剪枝后剪枝多变量决策树CART树决策树回归过程CART剪枝相关面试题决策树决策树是最符合人类思考模式,最容易被理解和解释的模型之一,所以在一些需要可解释性的场景下经常使用,其训练过程相比其他机器学习算法也更加通俗易懂训练过程初始情况下生成一个根节点,所有的数据都在这一个节点之内。寻找一个最能区分开不同类样本的最优划分属性,按照样本在该属性上取值的不同,分配到不同的下一级的子节点上。如果某个节点上没有了样本或

2020-06-02 21:35:45 1348

原创 SVM详解以及常见面试题

学习SVM的心得体会以及搜集的一些面试题SVM硬间隔SVM推导过程软间隔SVM推导过程支持向量回归SVR推导过程损失函数训练过程核函数SVM相关面试题SVMSVM的思想是在特征空间中找到一个超平面划分不同类,并且间隔最大的超平面意味着分类置信度比较大。硬间隔SVM如样本是线性可分的,则使用硬间隔的SVM,每个样本都是分类正确的推导过程空间超平面的方程为Wx+b = 0,W为平面法向量。点到平面的距离为最大化间隔即为具体取值无关,而1/W最大等价于W最大,所以问题等价于定义拉格朗日函数

2020-06-01 22:09:39 1338

原创 LR详解以及常见面试题

LR学习中的一点心得体会以及搜集的一些面试题LRLR相关面试题LRLR相关面试题

2020-06-01 19:30:17 2096

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除