weberyoung-CSDN博客

原创 LOF基于密度的异常检测

可达距离如果p点在k邻域外，那么可达距离就是真实距离，如果在k邻域内，那么就是k-距离。局部可达密度表⽰点p的邻域内其他点的局部可达密度与点p的局部可达密度之⽐的平均数。如果这个⽐值越接近1，说明o的邻域点密度差不多，o可能和邻域同属⼀簇；如果这个⽐值小于1，说明o的密度⾼于其邻域点密度，o为密集点；如果这个⽐值⼤于1，说明o的密度小于其邻域点密度，o可能是异常点。最终得出的LOF数值，就是我们所需要的离群点分数。在sklearn中有LocalOutlierFactor库，可以直接调⽤。

2021-01-21 22:09:19 645

原创异常检测-线性方法

PCA异常检测来自pyod的文档Principal component analysis (PCA) can be used in detecting outliers. PCA is a linear dimensionality reduction using Singular Value Decomposition of the data to project it to a lower dimensional space.In this procedure, covariance matri

2021-01-18 20:26:03 271

原创使用Pyod库的HBOS方法进行异常检测

HBOS算法1. 简介HBOS全名为：Histogram-based Outlier Score。它是⼀种单变量⽅法的组合，不能对特征之间的依赖关系进⾏建模，但是计算速度较快，对⼤数据集友好。其基本假设是数据集的每个维度相互独⽴。然后对每个维度进⾏区间(bin)划分，区间的密度越⾼，异常评分越低。为每个数据维度做出数据直⽅图。对分类数据统计每个值的频数并计算相对频率。对每个维度都计算了⼀个独⽴的直⽅图，其中每个箱⼦的⾼度表⽰密度的估计。然后为了使得最⼤⾼度为1（确保了每个特征与异常值得分的权重

2021-01-15 21:17:09 1495

原创异常检测概述

异常检测概述重点笔记异常检测应用领域传统方法集成方法机器学习的分类方法异常检测库PyOD异常检测应用领域故障检测物联网异常检测欺诈检测工业异常检测时间序列异常检测 Key视频异常检测日志异常检测医疗日常检测网络入侵检测基本都是无监督学习，不需要y。传统方法基于统计学假设数据服从某个分布，比如高斯分布，然后根据样本，运用极大似然估计求出分布的参数，然后把低概率区域的样本认为是异常值PCA主成分分析方法基于相似度的方法基于cluster簇的方法，如DBSCAN聚类算法

2021-01-12 20:38:16 208

原创 AAAI2021第一轮被拒经验分享

AAAI第一轮悲剧了俩5分俩评委给的意见都挺中肯的，主要还是创新性不过，加基线算法比较不够。对实验结果解释不足。感觉他们对实验方法细节并没有很着重看，更多的是宏观的评论。第一次投多少有点失望，虽然我是有一点自知之明的，paper内容是从图像那边借鉴到时间序列的加一些自己的创新，花了大约一个半月时间进行实验和写论文。确实也没有花太多时间，但是导师从头改到尾，另外进行了润色，心里感觉过意不去。。收获相对于期刊，会议的反馈周期确实短，很适合国内的研究环境。但是缺点也在于人多，不给再次修改的机会。根据这

2020-10-15 11:26:18 2613 1

原创 CondaHTTPError: HTTP 000 CONNECTION FAILED for url ＜https://repo.anaconda.com/pkgs/main/win-64/curre

用conda安装包的时候总是遇到这个错误然后从GitHub上搜了一下，发现有个国外的明白人。现在把解决办法贴出来:报错原因：As they are not found the search goes to C:\Windows\System32 where we have the same DLLs, installed by an other application, but with a different version.意思别的应用有相同的DLLs，所以冲突了解决办法：The D

2020-09-11 21:04:17 4747 6

原创 AAAI 2021 截止时间以及新的审稿机制

学习IJCAI的两阶段审稿法，第一阶段直接拒绝掉一部分。9.1号提交摘要，9.9号full paperLatex模板还没出，https://aaai.org/Conferences/AAAI-21/aaai21call/#

2020-07-22 16:53:52 7973 4

原创核函数的通俗解释实例

本来是想了解关于一些MMD的东西。然后里面也用到了核函数这个东西。早先是在SVM解决非线性问题时候接触的，那时候还比较懵懂。核函数到底是啥核函数其实准确来说就是一个内积，相似度，和那个映射函数没有任何关系（因为有时候你根本找不到那个映射函数），即使找到了映射函数也没啥意义。比如说你想把二维映射到三维，自己凑项数恰好凑成了二次多项式函数，最大的意义就是让你看清楚了原理。你的根本目的不就是图个省事在低维空间里面算内积嘛。然后再说一下英文里kernel trick本质是是个tirck就说明他确实不是什么太

2020-06-20 10:01:17 1029

原创 ACGAN和CGAN的区别

网络结构相同的是ACGAN和CGAN在生成器输入时候，噪音z都拼接了采集的labels。不同的是，ACGAN在判别器输入时，真假数据集都没有拼接labels，labels只是用来在辅助分类器中作为target_labels。而CGAN的判别器输入，真假数据集都拼接了labels。网络结构上，生成网络和鉴别网络的网络层不再是CGAN的全连接，而是ACGAN的深层卷积网络（这是在DCGAN开始引入的改变），卷积能够更好的提取图片的特征值，所有ACGAN生成的图片边缘更具有连续性，感觉更真实。CGA

2020-06-11 11:16:37 3413 2

原创 Latex写IEEEtrans如何添加参考文献

在tex文件同目录下，创建个reference.bib文件，然后去谷歌学术或者百度学术上面找到bibtex格式的引用复制进去。\bibliographystyle{IEEEtran}%这里选择的是IEEEtran，还可以选择不同的分风格 \bibliography{reference}%导入BibTeX.bib，然后就可以直接引用参考文献了，用\cite{XX}，XX是.bib文件中article后面的内容，如上所示将上面两句话放在参考文献的位置，%\begin{thebibliography}{1}.

2020-06-11 10:12:11 10889 4

原创 Leetcode每日一题：Daily Temperatures（递减栈）

Given a list of daily temperatures T, return a list such that, for each day in the input, tells you how many days you would have to wait until a warmer temperature. If there is no future day for which this is possible, put 0 instead.For example, given the

2020-06-11 09:56:44 176

原创 Ubuntu下载pytorch太慢情况解决

今天又迫不得已尝试下载pytorch比如从官网上找到对应配置和命令，直接输入，你会发现下载速度异常慢，而且中间会报错HTTP连接的错误，导致下载中断。然后你添加了国内的清华镜像依旧没有改善，根本原因在于上面的-c pytorch这句话...

2020-06-10 15:14:48 1053 1

原创 Leetcode: Count Number of Teams(中间枚举）

题目描述There are n soldiers standing in a line. Each soldier is assigned a unique rating value.You have to form a team of 3 soldiers amongst them under the following rules:Choose 3 soldiers with index (i, j, k) with rating (rating[i], rating[j], rating[k])

2020-06-10 11:32:33 250 1

原创等式方程的可满足性(并查集）

等式方程的可满足性给定一个由表示变量之间关系的字符串方程组成的数组，每个字符串方程 equations[i] 的长度为 4，并采用两种不同的形式之一：“a==b” 或 “a!=b”。在这里，a 和 b 是小写字母（不一定不同），表示单字母变量名。只有当可以将整数分配给变量名，以便满足所有给定的方程时才返回 true，否则返回 false。示例 1：输入：[“a==b”,“b!=a”]输出：false解释：如果我们指定，a = 1 且 b = 1，那么可以满足第一个方程，但无法满足第二个方程。没有

2020-06-08 11:54:05 316

原创 tensorflow的tf.nn.rnn_cell.LSTMCell和pytorch的nn.LSTM区别

tf.nn.rnn_cell.LSTMCell函数初始化:init(num_units,use_peepholes=False,cell_clip=None,initializer=None,num_proj=None,proj_clip=None,num_unit_shards=None,num_proj_shards=None,forget_bias=1.0,state_is_tuple=True,activation=None,reuse=None,name=None,

2020-06-06 21:56:12 3359 1

原创 LeetCode 最长连续序列（哈希表/并查集）

给定一个未排序的整数数组，找出最长连续序列的长度。要求算法的时间复杂度为 O(n)。示例:输入: [100, 4, 200, 1, 3, 2]输出: 4解释: 最长连续序列是 [1, 2, 3, 4]。它的长度为 4。来源：力扣（LeetCode）链接：https://leetcode-cn.com/problems/longest-consecutive-sequence思路：难点主要就是时间复杂度要求O（n）正常思路是排序：从小到大排序遍历数组，比较相邻的两项，如果相同，则跳过，

2020-06-06 14:53:12 171

原创顺时针打印矩阵(从左到右，从上到下，从右到左，从下到上）

输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。示例 1：输入：matrix = [[1,2,3],[4,5,6],[7,8,9]]输出：[1,2,3,6,9,8,7,4,5]示例 2：输入：matrix = [[1,2,3,4],[5,6,7,8],[9,10,11,12]]输出：[1,2,3,4,8,12,11,10,9,5,6,7]限制：0 <= matrix.length <= 1000 <= matrix[i].length <= 100来

2020-06-05 16:46:22 584

原创经典24点游戏（简单易懂的回溯法）

你有 4 张写有 1 到 9 数字的牌。你需要判断是否能通过 *，/，+，-，(，) 的运算得到 24。示例 1:输入: [4, 1, 8, 7]输出: True解释: (8-4) * (7-1) = 24示例 2:输入: [1, 2, 1, 2]输出: False注意:除法运算符 / 表示实数除法，而不是整数除法。例如 4 / (1 - 2/3) = 12 。每个运算符对两个数进行运算。特别是我们不能用 - 作为一元运算符。例如，[1, 1, 1, 1] 作为输入时，表达式 -1 -

2020-06-04 22:28:04 2793

原创 PPT如何改默认字体？

网上都说插入文本框然后设置默认文本字体但是我并没有发现这个选项。实际上应该用幻灯片母版视图进行修改点进去幻灯片母版，然后设置字体就可以了

2020-06-04 09:34:38 1340

原创 nvcc -V和 cat /usr/local/cuda/version.txt 命令显示的cuda版本不一样

因为之前服务器停电重启cuda10.0版本突然没了，所以我的pytorch运行报错，和cuda的版本不匹配。所以我不得不重新安装cuda新版本。网上说nvcc -V和cat /usr/local/cuda/version.tx都可以查看cuda版本，但是我的版本一个是8.0，一个是9.0.然后使用which nvcc 命令查看了属于cuda90的文件夹中。...

2020-06-04 09:30:26 3349 1

原创学校服务器重启之后cuda版本和Nvidia GPU Driver too old

学校的服务器停电之后重启然后cuda版本变成8.0，原来是10.0。运行pytorch时候报错显卡驱动也太旧了不匹配。有没有经历过类似情况的小伙伴帮助一下

2020-05-30 20:31:28 556

原创《深度学习》：循环神经网络II

第8讲循环神经网络II–长程依赖问题–长短期记忆网络（LSTM）–门控循环神经网络（GRU）–深层循环神经网络–实验④（循环神经网络实验）布置文章目录RNN的长时依赖问题长短时记忆网络（LSTM）深入了解LSTM结构具体原理GRUGRU结构更新记忆阶段LSTM和GRU的联系RNN的作业布置参考文献RNN的长时依赖问题首先回顾一下上篇文章推导出来的RNN的误差项随时间反向传播的公式。（误差项：误差EEE对神经元j的输出netjnet_jnetj的偏导）我们可以看到，误差项从t时刻传.

2020-05-17 17:30:45 777

原创 LeetCode每日一题：课程表II（拓扑排序，有向无环图）

课程表II现在你总共有 n 门课需要选，记为 0 到 n-1。在选修某些课程之前需要一些先修课程。例如，想要学习课程 0 ，你需要先完成课程 1 ，我们用一个匹配来表示他们: [0,1]给定课程总量以及它们的先决条件，返回你为了学完所有课程所安排的学习顺序。可能会有多个正确的顺序，你只要返回一种就可以了。如果不可能完成所有课程，返回一个空数组。示例 1:输入: 2, [[1,0]]输出: [0,1]解释: 总共有 2 门课程。要学习课程 1，你需要先完成课程 0。因此，正确的课程顺序为 [

2020-05-17 12:59:47 1141

原创《深度学习》：循环神经网络I

《深度学习》课程资料第7讲循环神经网络I–网络记忆能力–循环神经网络（RNN）–随时间反向传播（BPTT）–双向循环神经网络第8讲循环神经网络II–长程依赖问题–长短期记忆网络（LSTM）–门控循环神经网络（GRU）–深层循环神经网络–实验④（循环神经网络实验）布置1 引言全连接神经网络和卷积神经网络都只能单独的取处理一个个的输入，前一个输入和后一个输入是完全没有关系的。但是，某些任务需要能够更好的处理序列的信息，即前面的输入和后面的输入是有关系的。比如，当我们在理解一句.

2020-05-16 17:59:33 782

原创在服务器中nohup后台训练，python的print无法重定向输出到文件里

今天在服务器上跑个模型，发现以前一直能打印训练过程的内容，今天不显示了。后来查了查是因为python有缓存输出的，所以不能暂时显示print的内容，在运行命令中加个-u就可以了nohup python -u …...

2020-05-15 22:26:12 1521

原创又是异或！面试题 16.01. 交换数字

编写一个函数，不用临时变量，直接交换numbers = [a, b]中a与b的值。示例：输入: numbers = [1,2]输出: [2,1]提示：numbers.length == 2来源：力扣（LeetCode）链接：https://leetcode-cn.com/problems/swap-numbers-lcci一开始把两数之和存到一个元素中，然后分别做差。但是运行错误溢出了。后来看题解，又是利用了异或运算。class Solution {public: vector

2020-05-14 22:54:43 239

原创 LeetCode每日一题：只出现一次的数字（异或）

只出现一次的数字给定一个非空整数数组，除了某个元素只出现一次以外，其余每个元素均出现两次。找出那个只出现了一次的元素。说明：你的算法应该具有线性时间复杂度。你可以不使用额外空间来实现吗？示例 1:输入: [2,2,1]输出: 1示例 2:输入: [4,1,2,1,2]输出: 4思路：首先一上来就是想的哈希表存储，但是无法在O(1)空间复杂度完成，空间复杂度位O（n）然后看题，只有一个数字出现一次，剩下的都出现两次，使用异或运算，异或运算满足交换律，相同得0，非零数字和0异或结果为本

2020-05-14 22:25:11 228

原创论文阅读：《Time Series Generative Adversrial Networks》（TimeGAN，时间序列GAN)

这篇时间序列GAN的论文下载了好久了，但是由于过于复杂，没怎么仔细研读。最近为了进行和自己的GAN对比，找到了他的codebase 准备再仔细读一下，跑一下代码。《Time Series Generative Adversrial Networks》作者：JinsungYoonUniversity of California, Los Angeles, USA jsyoon0823@g.ucla.eduDanielJarrettUniversity of Cambridge, UK daniel

2020-05-11 22:33:19 13965 26

原创 LeetCode每日一题：Pow(x, n)（分治）

Pow(x, n)实现 pow(x, n) ，即计算 x 的 n 次幂函数。示例 1:输入: 2.00000, 10输出: 1024.00000示例 2:输入: 2.10000, 3输出: 9.26100示例 3:输入: 2.00000, -2输出: 0.25000解释: 2-2 = 1/22 = 1/4 = 0.25说明:-100.0 < x < 100.0n 是 32 位有符号整数，其数值范围是 [−231, 231 − 1] 。爆破方法不必说肯定超时。可以考

2020-05-11 22:12:57 274

原创 LeetcCde每日一题：二叉树的最近公共祖先（递归）

二叉树的最近公共祖先给定一个二叉树, 找到该树中两个指定节点的最近公共祖先。百度百科中最近公共祖先的定义为：“对于有根树 T 的两个结点 p、q，最近公共祖先表示为一个结点 x，满足 x 是 p、q 的祖先且 x 的深度尽可能大（一个节点也可以是它自己的祖先）。”例如，给定如下二叉树: root = [3,5,1,6,2,0,8,null,null,7,4]示例 1:输入: root = [3,5,1,6,2,0,8,null,null,7,4], p = 5, q = 1输出: 3解释:

2020-05-10 10:08:51 166

原创 Parzen窗估计和k近邻估计区别

这两种都是经典的非参数估计。Parzen窗就是固定一个窗宽h（区间体积V），然后计算一下x的周围点xix_ixi相对于x本身再除以h的距离： x−xih\frac{x-x_i}{h}hx−xi，将其作为自变量代入核函数（窗函数），一般就是矩形窗（h范围内权重为1，范围外权重为0），或者高斯窗（近大远小）。k近邻估计就是固定V内的样本数，改变V的大小来进行趋近。...

2020-05-09 11:20:18 1691

原创论文阅读《生成模型的评估》：A NOTE ON THE EVALUATION OF GENERATIVE MODELS

最近在做GAN相关的东西，导师推荐了一篇生成模型评估的文章，读一读当作笔记。作者：LucasTheis∗ University of T¨ubingen 72072 T¨ubingen, Germany lucas@bethgelab.orgA¨aronvandenOord∗† Ghent University 9000 Ghent, Belgium aaron.vandenoord@ugen...

2020-05-09 10:59:13 989

原创综述：运动目标跟踪算法

运动目标跟踪算法总结1 传统的目标跟踪算法运动目标跟踪，首先对目标进行有效地表达。然后在接下来的视频序列的每一帧中找到相似度与目标最大的区域，从而确定目标在当前帧中的位置。早期的生成式方法主要有两种思路: 1) 依赖于目标外观模型。通过对目标外观模型进行建模，然后在之后的帧中找到目标。例如: 光流法。2) 不依赖于目标外观模型。选定目标建立目标模型，然后在视频中搜索找到目标模型...

2020-05-08 11:27:36 4678 2

原创深度学习语音识别方法概述与分析

1 语音识别方法研究现状随着人机交互技术越来越受到人们的重视，而人通过语音与计算机进行交互是除了手动键盘输入之外最自然最基本的交互方式，所以也越来越引起研究人员的关注。语音识别方法即自动语音识别( automatic speech recognition，ASR) 技术，主要是完成语音到文字的转变，属于非特定人语音识别。语音识别发展到现在，已经改变了人们生活的很多方面，从语音打字机、数据库检...

2020-05-08 11:24:19 11521 1

原创 WGAN与GAN的区别

代码上与GAN的区别只有四点：判别器最后一层去掉sigmoid 生成器和判别器的loss不取log 每次更新判别器的参数之后把它们的绝对值截断到不超过一个固定常数c 不要用基于动量的优化算法（包括momentum和Adam），推荐RMSProp，SGD也行...

2020-05-08 11:03:13 2652

原创 weka实现TAN(树增强朴素贝叶斯）

1 NaiveBayes的局限朴素贝叶斯成立最关键的假设就是属性之间相互独立。然而，这在现实生活中几乎是不可能的。虽然利用属性之间相互独立的假设，可以获得令人意想不到很好的分类正确率，但是如果知道属性之间的依赖，那岂不是能获得更高的分类正确率。自然而然的想法就是建立属性之间的依赖关系。但是过于复杂的依赖关系将导致计算机复杂度的提升，对于解决实际问题又是不可取的。计算机科学是关于“trad...

2020-05-08 10:56:32 1740 1

原创人脸检测概述（不是人脸识别）

目录1 引言... 32 人脸检测技术的发展与现状... 43 人脸检测算法相关工作... 43.1 评价指标... 53.2 人脸检测常用数据库... 63.2.1 FDDB数据库... 63.2.2 WIDER FACE数据库... 64 深度学习人脸检测算法... 74.1 卷积神经网络... 74.2 级联卷积神经网络（Cascde...

2020-05-08 10:53:17 6406 3

原创机器学习——概率密度估计随笔

概率密度估计笔记概率与统计关系参数估计似然与概率似然函数与概率函数极大似然估计最大后验估计（MAP）贝叶斯估计非参数估计直方图Parzen窗（核密度估计）概率与统计关系先捋清楚概率和统计分别是啥意思。下面的一段话引自LarrB Wasserman的《All of Statistics》，对概率和统计推断的研究内容进行了描述：The basic problem that we studB i...

2020-05-07 23:29:19 1242

sifi和surf比较作业.zip

算法设计与分析-模拟试题(1).docx

1_2019研究生《机器学习》期末试题参考答案20200104.docx

空空如也