Sigyc-CSDN博客

原创论文笔记 AAAI2020 Multi-View Partial Multi-label Learning with Graph-based Disambiguation

论文笔记论文阅读背景介绍提出的方法Candidate Labels DisambiguationDisambiguation-Guided Model Induction实验最近看到了这篇文章，觉得可以拿来参考，先做个阅读笔记记录一下。论文阅读先附上论文地址背景介绍这篇文章研究的问题是在多视图多标签学习（MVML）学习中标签不可信的问题。在常规的MVML研究中，通常假定针对每个训练实例都已对所有相关标签进行了精确注释。但是，在许多现实世界的场景中，通常很难获得精确的注释，而且成本很高。所以文

2020-08-06 16:26:37 1264 1

原创 LeetCode每日一题8月记录

LeetCode每日一题8月记录8.1 最小区间8.1 最小区间原题地址.变相的用滑动窗口法求解，统计每个数字出现在输入的哪几个数组里面，然后利用双指针滑动窗口寻找最小的左右边界，使得全部数组都有这些元素。class Solution: def smallestRange(self, nums: List[List[int]]) -> List[int]: n = len(nums) indices = collections.defaultdict(l

2020-08-01 09:26:19 1015

原创 GBDT、Xgb、Lgb对比以及常见面试题

GBDT、Xgb、Lgb对比以及常见面试题GBDT特点正则化Xgb特点正则化Lgb常见面试题RF与GBDT之间的区别Xgb与GBDT的区别Lgb与Xgb的区别之前写了一点RF的东西，作为决策树+bagging的模型自然经常会被拉出来和决策树+boosting的模型进行对比；而GBDT、Xgb、Lgb一系列的产物正式这种思路加上一些改进的工程产物，所以就一起放出来对比说明了。GBDT特点GBDT 是梯度提升树（Gradient Boosting Decison Tree）的简称，GBDT 通过多轮迭代

2020-07-16 22:13:33 5041

原创 RF详解以及常见面试题

学习RF的心得体会以及搜集的一些面试题RF数据集随机节点特征随机RF相关面试题随机森林与SVM的比较RF抗过拟合强的原因RF和GBDT的区别RF之前说过了决策树,试想一下如果有很多千姿百态的决策树组成了一个森林，那么以每个树的预测结果投票得到最后的模型输出的话，是不是能得到一个更加鲁棒，抗过拟合能力比较好的模型了。回顾一下决策树生成的过程，重复对一个数据集生成决策树的话，树形是确定的，也就是说每次生成的树是一样的，这样的话就达不到生成千姿百态的决策树再组成森林的目的了；同样的决策树组成森林结果是不变的

2020-07-14 21:13:31 1971

原创 AAAI2020多视图学习模型MvNNcor对多标签任务迁移

AAAI2020多视图学习模型MvNNcor对多标签任务迁移的一些思路想法

2020-07-13 20:17:26 545

原创论文笔记 AAAI2020 Deep Embedded Complementary and Interactive Information for Multi-view Classification

AAAI2020的多视图学习论文 Deep Embedded Complementary and Interactive Information for Multi-view Classification的阅读笔记以及代码复现

2020-07-07 20:01:18 1445 1

原创 PyTorch的nn.LSTM使用说明

PyTorch的nn包下面自带很多经典的模型，我们可以快速的引入一个预训练好了的模型用来处理我们的任务，也可以单纯的添加一个这种架构的空白网络称为我们模型的子结构。其中LSTM是使用的相当多的一个，本文介绍nn.LSTM的一些使用情况。

2020-07-03 20:50:17 17779 1

原创注意力机制以及应用

注意力机制以及应用注意力机制的由来二级目录三级目录Attention成为了越来越来模型里绕不过去的坎，好像不过怎么样都加一个，那么注意力机制到底是什么以及计算流程和具体应用有哪些呢，今天来简单罗列一下。注意力机制的由来可以粗略地把注意力机制类比成一个可以专注于输入内容的某一子集（或特征）的神经网络，着力于占比不大但是格外重要的部分。二级目录三级目录...

2020-07-01 21:17:37 2870

原创 LeetCode每日一题7月记录

LeetCode每日一题7月记录7.1最长重复子数组7.1最长重复子数组原题地址.A[i:]和B[j:]的最长重复长度为A[i+1:]和B[j+1:]最长长度加1（如果A[i]==B[j]），所以可以用动态规划思想解决。class Solution: def findLength(self, A: List[int], B: List[int]) -> int: n = len(A) m = len(B) dp = [[0] * (m+1

2020-07-01 08:46:38 1040

原创 Pytorch学习笔记-第十章

Pytorch学习笔记-第十章图像描述data_preprocessdatafeature_extractmodelmain记录一下个人学习和使用Pytorch中的一些问题。强烈推荐《深度学习框架PyTorch：入门与实战》.写的非常好而且作者也十分用心，大家都可以看一看，本文为学习第十章图像描述的学习笔记。主要分析实现代码里面main，data，data_preprocess，feature_extract这5个文件完成整个项目模型结构定义，训练及生成，还有输出展示的整个过程。data_prepr

2020-06-29 19:46:24 399

原创 Pytorch学习笔记-第九章

Pytorch学习笔记-第九章RNN诗人utilsdatamodelmainTrain前缀诗生成藏头诗生成记录一下个人学习和使用Pytorch中的一些问题。强烈推荐《深度学习框架PyTorch：入门与实战》.写的非常好而且作者也十分用心，大家都可以看一看，本文为学习第九章RNN诗人的学习笔记。主要分析实现代码里面main，data，model，utils这4个代码文件完成整个项目模型结构定义，训练及生成，还有输出展示的整个过程。utils这个文件没啥好说的了，就是封装了一个visdom对象，再多加

2020-06-28 21:43:40 1005

原创 LeetCode卡片探索-中级算法

卡片探索-中级算法数组和字符串三数之和矩阵置零字母异位词分组无重复字符的最长子串最长回文子串递增的三元子序列链表树和图回溯算法排序和搜索动态规划设计问题数学其他LeetCode上知识卡片之中级算法的刷题记录数组和字符串三数之和把数组排序后，遍历数组，每次固定当前元素，然后用双指针再后续数组里面搜索与它相加为0的元素组合。class Solution: def threeSum(self, nums: List[int]) -> List[List[int]]: n=l

2020-06-28 09:54:41 1347

原创连续值特征分桶区间设置

连续值特征分桶区间设置依靠实际意义依靠数学分析oddsWOEIV值等宽等频K-means卡方统计我们实际遇到的数据经常会是连续取值的数据，比如一些表示计数或者量级的属性。有些模型比如常用的梯度提升树系列（GBDT,XGB,LGB）可以不做任何处理的直接输入；也有些模型（lr,nn）把数值属性去除量纲后就可以作为输入;但是一般为了方便处理或者提取出更有用的信息我们会做分桶或者说分箱处理。设置几个阈值把总的取值区间划分为几个小区间，每个样本的取值就会落在其中一个区间，如果阈值设置的好的话相当于人工

2020-06-27 22:50:21 2182

原创 Pytorch学习笔记-第八章

Pytorch学习笔记-第八章风格迁移utilsGram矩阵PackerVGGtransformermain训练生成图片记录一下个人学习和使用Pytorch中的一些问题。强烈推荐《深度学习框架PyTorch：入门与实战》.写的非常好而且作者也十分用心，大家都可以看一看，本文为学习第八章风格迁移的学习笔记。主要分析实现代码里面main，transformer，PackedVGG，utils这4个代码文件完成整个项目模型结构定义，训练及生成，还有输出展示的整个过程。utils这是项目中用到的一些额外工

2020-06-27 18:35:52 672

原创 Pytorch学习笔记-第七章

Pytorch学习笔记-第七章GAN生成动漫头像model文件生成器判别器visualize文件main文件数据处理训练判别器生成器生成结果记录一下个人学习和使用Pytorch中的一些问题。强烈推荐《深度学习框架PyTorch：入门与实战》.写的非常好而且作者也十分用心，大家都可以看一看，本文为学习第七章GAN生成动漫头像的学习笔记。主要分析实现代码里面main，model，visualize这3个代码文件完成整个项目模型结构定义，训练及生成，还有输出展示的整个过程。model文件整个模型结构是经

2020-06-26 16:59:22 427

原创 Pytorch学习笔记-第六章

Pytorch学习笔记-第六章猫狗大战记录一下个人学习和使用Pytorch中的一些问题。强烈推荐《深度学习框架PyTorch：入门与实战》.写的非常好而且作者也十分用心，大家都可以看一看，本文记录按照该书学习Pytorch时在第六章猫狗大战遇到的一些问题。...

2020-06-16 19:36:26 288

原创从经典到深度学习的数据补全

数据补全方法MissForestGAINMissForestGAIN

2020-06-15 21:42:27 7664 2

原创 py和ipynb文件互相转化

py和ipynb文件互相转化ipynb转pypy转ipynb越来越多使用python人投入了jupyter notebook的怀抱，比如我哈哈。单元型运行，随时保存输出中间变量结果，方便的输出展示尤其是绘图，以及一堆扩展插件让人感受这份友好；但也不免有些小问题，notebook产生的ipynb怎么变成py文件，而正常的py文件怎么转移到notebook里运行呢。ipynb转py1.首先进入想要转换的ipynb文件所在目录，然后输入如下指令jupyter nbconvert --to script fi

2020-06-14 23:14:10 20657

原创数据降维以及相关面试题

数据降维以及相关面试题降维PCA方差最大化重构损失最小求解过程投影后数据的一些性质细节LDA原理推导核化处理降维所谓的降维就是指采用某种映射方法，将原高维空间中的数据点映射到低维度的空间中。那么为什么我们需要对数据降维？数据维度太高，样本量稀疏，给机器学习算法带来巨大的时间性能花费。有些特征之间存在相关关系，增加了分析难度，所以用更少数量的不相关的特征代替。接下来介绍一下常用降维方法。PCA如果我们要把原数据投影到一个低维空间，怎么衡量我们投影后的数据好坏呢？我们要认识到数据的方差代表着

2020-06-14 20:50:50 1033

原创 Pytorch学习笔记-第五章

Pytorch学习笔记-第五章常用模块数据处理视觉工具包torchvisionImageFolderDataLoader多进程Sample可视化工具TensorboardVisdomGPU加速cuda损失函数使用建议并行化固化数据一般Tensormodle和Optimizer记录一下个人学习和使用Pytorch中的一些问题。强烈推荐《深度学习框架PyTorch：入门与实战》.写的非常好而且作者也十分用心，大家都可以看一看，本文记录按照该书学习Pytorch时在第五章常用模块遇到的一些问题。数据处理数

2020-06-14 15:25:24 497

原创 LeetCode卡片探索-初级算法

卡片探索-初级算法数组删除排序数组中的重复项买卖股票的最佳时机 II字符串链表树排序和搜索动态规划设计问题数学其他LeetCode上知识卡片之初级算法的刷题记录数组删除排序数组中的重复项难点在于原地删除的同时不想时间复杂度太高的话，可以考虑双指针。一个指针遍历数组判断是否为重复元素，一个指针用来搜集不重复元素并把他们安排到数组前列。class Solution: def removeDuplicates(self, nums: List[int]) -> int: i

2020-06-14 10:04:30 1236

原创 Pytorch学习笔记-第四章

Pytorch学习笔记-第四章nn模块第四章nn注意事项全连接层多层子module卷积层池化层BN层dropout激活函数序列化网络RNNembedding层损失函数优化器nn.functional初始化策略深入理解nn.Module复杂网络中的嵌套复杂网络中的dropout钩子函数模型保存GPU运行nn与autograd的关系记录一下个人学习和使用Pytorch中的一些问题。强烈推荐《深度学习框架PyTorch：入门与实战》.写的非常好而且作者也十分用心，大家都可以看一看，本文记录按照该书学习Pyto

2020-06-13 17:05:33 995

原创模型融合Stacking和Blending

模型融合BlendingStacking区别各种比赛中常常见到在特征工程和调参取不到太大的进步的时候，转而进行模型融合操作。常用方法用Stcaking和Blending，该文记录一下学习使用中的情况。Blending数据划分为不相交的部分，一部分用来训练不同的 Base Model，将它们对另外部分的数据输出取（加权）平均。实现简单，但对训练数据利用少了。可以通过对输出组合成一份数据，在其上训练一个LR模型。要求个别单模型效果要好而且模型之间有差异。Stackingstacking可以看作是复杂

2020-06-12 22:15:17 344

原创 Pytorch学习笔记-第三章

Pytorch学习笔记-第三章Tensor和AutogradTensor创建size调整索引高级索引Tensor类型逐元素操作归并操作比较线性代数操作numpy和tensor广播内部结构向量化Autograd反向传播计算图扩展autograd记录一下个人学习和使用Pytorch中的一些问题。强烈推荐《深度学习框架PyTorch：入门与实战》.写的非常好而且作者也十分用心，大家都可以看一看，本文记录按照该书学习Pytorch时在第三章Tensor和Autograd遇到的一些问题。Tensor对tens

2020-06-12 22:14:30 759

屏幕里的日与夜