- 博客(25)
- 收藏
- 关注
转载 命令行执行python模块时提示ImportError: No module named xxx
命令行执行python模块时提示ImportError: No module named xxx在pycharm中运行python文件没有问题,切换到cmd中是提示:ImportError: No module named xxx原因:pycharm在运行时会把当前工程的所有文件夹路径都作为包的搜索路径,而命令行默认只是搜索当前路径。’解决方法:在出错的模块中加上impor...
2018-05-21 16:09:19 2414
原创 关于为什么pagerank能收敛
关于为什么pagerank能收敛pagerank的主要思想如果一个网页被很多其他网页链接到的话说明这个网页比较重要,也就是PageRank值会相对较高如果一个PageRank值很高的网页链接到一个其他的网页,那么被链接到的网页的PageRank值会相应地因此而提高算法原理PageRank算法是互联网中的众多网页看做是一个有向图,如上图所示。算法过程是把网页...
2018-05-06 23:01:30 6409
原创 机器学习中的范数
机器学习中的范数L0范数 LO范数是向量中非零元素的数目如果采用L0范数来规划化一个参数矩阵的,就是为了让矩阵稀疏,希望大部分权值都为0。但是,这个术语在数学意义上是不对的,非零元素的数目不是范数,因为对向量缩放α\alpha 倍不会改变该向量的非零数目。L1范数 L1范数是向量中各个元素的绝对值的和,也叫做『稀疏规则算子』L1范数能够实现权值稀疏,任何的规范化的算子,如果他在Wi=
2018-04-30 13:46:37 1695
原创 EM推导PLSA模型
EM推导PLSA模型回归EM算法以上是EM算法的框架,基本思想是:E步骤:求当隐变量给定后当前估计的参数条件下的后验概率M步骤:最大化complete data对数似然函数的期望,把E步当做是已知值,得到新的参数值不断迭代以上步骤直到收敛。plsa模型简介PLSA应用于信息检索、过滤、自然语言处理等领域,考虑到词分布和主题分布,可以看做概率化的矩阵分解,采用...
2018-02-10 19:31:40 1689
原创 从两个例子理解EM算法
从两个例子理解EM算法本文是作者对EM算法学习的笔记,从EM算法出发介绍EM算法,为了更好理解,用两个应用EM算法求解的例子进一步解释EM的应用。EM算法EM算法引入EM算法,指的是最大期望算法(Expectation Maximization Algorithm,期望最大化算法),是一种迭代算法,在统计学中被用于寻找,依赖于不可观察的隐性变量的概率模型中,参数的最大似...
2018-02-10 00:01:55 12860 3
原创 变分推断
变分推断变分推断就是用简单的分布q去近似复杂的分布p。以上这句话是对变分推断最直接的理解。那么,为什么要选择用变分推断?因为,大多数情况下后验分布很难求。如果后验概率好求解的话我们直接采用EM就可以。当后验分布难于求解的时候我们就希望选择一些简单的分布来近似这些复杂的后验分布。特别的,如果我们选择的q是指数族内的分布,更易于积分求解。Evidence Lower Bound(EL
2018-01-27 21:30:48 1181
原创 链表的环问题
链表的环问题如何判断链表中是否有环,若存在环,如何找到入口?方法一:使用额外的空间 利用一个map记录已经存在的node, 当出现第二次即为存在环也是环的入口。方法二:不使用额外的空间先解决是否有环的问题,设置快慢指针,类别是跑步问题,在一个环形跑道上跑快的总会追赶上慢的,那么,如果存在环,快指针总会追上慢指针的。(在链表问题中,使用快慢指针是一个很重要的技巧)下面是求环的
2018-01-25 21:34:04 267
原创 Online LR—— FTRL 算法理解
Online LR—— FTRL 算法理解Online Learning定义Online Learning是一种模型训练的方法,能够根据线上反馈数据,实时快速的进行模型调整,使得模型及时反映线上的变化,提高线上预测的准确率。Online Learning的流程包括:将模型预测结果展现给用户,然后收集用户的反馈数据,再来训练模型,形成闭环的系统。与传统训练方法的区别传统的训练方法
2018-01-22 10:13:45 5456 2
原创 [leetcode] min stack问题
min stack问题问题描述 Design a stack that supports push, pop, top, and retrieving the minimum element in constant time.push(x) -- Push element x onto stack.pop() -- Removes the element on top of t
2018-01-17 15:26:00 264
原创 正则表达式匹配
请实现一个函数用来匹配包括'.'和'*'的正则表达式。模式中的字符'.'表示任意一个字符,而'*'表示它前面的字符可以出现任意次(包含0次)。 在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串"aaa"与模式"a.a"和"ab*ac*a"匹配,但是与"aa.a"和"ab*a"均不匹配。 对字符串的每个字符而言匹配的规则是相同,因此可以想到用递归来求解问题。 处理特殊符号“
2018-01-16 14:59:20 440
原创 证明 gibbs sampling 是接受率为1 的Metropolis Hasting 特例
证明 gibbs sampling 是接受率为1 的Metropolis Hasting 特例首先回顾下 gibbs sampling 以及 MH算法Metropolis Hasting Algorithmgibbs sampling 下面来证明 gibbs sampling是接受率为1的Metropolis Hasting的特例: 在gibbs sampling
2018-01-10 10:58:01 1092
原创 整数中1出现的次数
整数中1出现的次数**题目描述** 求出1~13的整数中1出现的次数,并算出100~1300的整数中1出现的次数?为此他特别数了一下1~13中包含1的数字有1、10、11、12、13因此共出现6次,但是对于后面问题他就没辙了。ACMer希望你们帮帮他,并把问题更加普遍化,可以很快的求出任意非负整数区间中1出现的次数。分析: 本题比较容易想到的点就是分别计算个位、十位以及更高位中的1
2018-01-09 16:31:08 247
转载 [转载] Eclipse引用第三方jar包项目打包成jar文件
用Eclipse自带的Export功能步骤1:准备主清单文件 “MANIFEST.MF”,由于是打包引用了第三方jar包的Java项目,故需要自定义配置文件MANIFEST.MF,在该项目下建立文件MANIFEST.MF,内容如下:Manifest-Version: 1.0Class-Path: lib/commons-codec.jar lib/commons-httpclient-3.1.ja
2017-12-28 15:23:58 288
转载 [转载]如何解决failed to push some refs to git
在使用git 对源代码进行push到gitHub时可能会出错,信息如下 如何解决failed to push some refs to git 此时很多人会尝试下面的命令把当前分支代码上传到master分支上。 $ git push -u origin master 但依然没能解决问题如何解决failed to push some refs to git 出现错误的主要原因是githu
2017-12-28 15:10:01 304
原创 VAE详细推导
本文是对VAE的loss的详细推导先上两个图解释下VAE在这两个的基础上,我们可以定义data likelihood:为什么要采用变分由于MCMC算法的复杂性,对于qϕ(z|x)q_{\phi}(z|x),如果对每个数据点都要大量采样,在大数据情况下是难以实现的,因此需要找一个近似的方法。变分推理的思想就是寻找一个容易处理的分布使得与目标分布尽量接近来代替它。上述公式的第二部分就是利用pθ(z)p
2017-12-22 11:02:37 17499 1
原创 逆序对问题
最近刷leetcode 315. Count of Smaller Numbers After Self,遇到问题所以想趁机总结下这类问题。逆序对定义 在数组中的两个数字,如果前面一个数字大于后面一个数字,则这两个数字组成一个逆序对。递归问题求解逆序对 就是将数组分为两部分,左边数组中有left个逆序对,右边数组中有right逆序对,还有一种这个逆序对存在左右两个数组之间。public cla
2017-12-15 19:29:32 358
原创 corenlp多线程使用
本文的应用是stanford corenlp多线程的使用,在对数据进行分词、词性标注和命名实体识别的过程数据量较大,处理时间较长,单线程已经不能满足需求。这个使用场景是,读取文本,每一行是一个json类型的字符串,需要将其中部分文本进行词性标注等处理,然后再写到新的一个文件中(**多线程读同一个文件,处理后,多线程写同一个文件**)- java 使用corenlpjava中的多线程下图所示是一个线
2017-12-02 16:08:16 1003
原创 java 中的json包
首先要说下之前用的是json lib那个包,在应用过程中有个bug, 于是选用了轻量级的解析工具包org.json.jar在用json lib这个包时,同时需要你加入其他的依赖包,需要注意各依赖包之间的版本兼容。在应用过程中,出现如下问题: JSONObject obj = new JSONObject(); obj.put("test_string", "null") //put进去的是字
2017-12-02 13:09:32 3259 2
翻译 BiLSTM_CRF-序列标注
CRF Layeremission score: 这个分数来自于BiLSTM层,即是下图黄色框框中的值 transition score 表示从一个状态转移到另一个状态的可能性,在模型开始训练前随机初始化,在训练的过程中实现更新。loss function LossFunction=PrealpathP1+P2+...+PNLossFunction = \frac{P_{realpath}}{
2017-11-20 16:03:08 3822 1
原创 tensorflow中的CRF
tensorflow中的CRF先说说本文背景,是作者需要用bilstm+crf实现sequences labeling,因此调研了tensorflow中如何实现CRF。几个方法tf.contrib.crf.crf_log_likelihoodcrf_log_lmelihood ( inputs , tag_indices , sequence_leng
2017-11-20 14:40:13 7386
原创 tensorflow实现迁移学习实例
tensorflow实现迁移学习实例 本文主要是总结利用tensorflow实现迁移学习的基本步骤。所谓迁移学习,就是将上一个问题上训练好的模型通过简单的调整使其适用于一个新的问题。比如说,我们可以保留训练好的Inception-v3模型中所有的参数,只替换最后一层全连接层。在最后一层全连接层之前的网络称之为瓶颈层(bottleneck)。持久化首先需要简单介绍下tensorflow中的持久化
2017-10-11 11:16:44 7823 3
原创 tensorflow卷积神经网络例子学习笔记
tensorflow卷积神经网络例子 本文是对tensorflow教程中的cifar数据集卷积神经网络例子进行学习后的笔记,主要记录了一些相关方法的使用。
2017-09-19 15:48:56 906
原创 RNN及其公式推导
RNN及其公式推导 RNN即循环神经网络,循环神经网络的种类有很多,本文主要是对基本的神经网络进行推导。一开始对推导很晕,在阅读了许多资料之后,整理如下。结构
2017-09-13 19:33:41 12237 2
原创 常见采样方法
sampling学习小结本文是在阅读prml的第11章后,写的一个总结。 首先要说说为什么需要采样。通常没我们会遇到很多问题无法用分析的方法求得精确解,例如待求问题很复杂。遇到这种情况的时候,人们通常会采用一些方法得到近似解,其中随机模拟就是一类近似求解的方法,采样就是随机模拟的核心。-基本方法: 从基本概率分布产生新变量分布,假设有某分布的分布函数是F(x
2017-09-05 20:06:47 2265
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人