Arthur的随笔

The More I Learn, The Less I Know, Tracking Mind Only With Code

JVM ClassLoader笔记

非常详细的ClassLoader介绍:https://blog.csdn.net/briblue/article/details/54973413 在此下载jdk7源码:http://jdk7src.sourceforge.net/ 三个内建ClassLoader BootstrapClassLo...

2019-04-16 17:56:12

阅读数 26

评论数 0

从0开始学架构课后题

01. 你原来理解的架构是如何定义的?对比我今天讲的架构定义,你觉得差异在哪里? 02.为何结构化编程、面向对象编程、软件工程、架构设计最后都没有成为软件领域的银弹? 03. 请按照“架构设计的主要目的是为了解决软件复杂度带来的问题”这个指导思想来分析一下你目前的业务系统架构,看看是否和你当时...

2019-04-08 23:40:39

阅读数 3419

评论数 0

plda源码(十二)

plda源码(十一) LightLDA Gibbs Sampling p(zdi=k∣rest)∝(nkd−di+αk)(nkw−di+βw)nk−di+βp(z_{di}=k | rest) ∝ \frac{(n^{−di}_{kd}+\alpha_k)(n^{−di}_{kw}+\bet...

2019-02-01 15:56:48

阅读数 114

评论数 0

plda源码(十一)

class VoseAlias { public: unsigned short n; //Dimension double wsum; //Sum of proportions std::vector<std::pair&...

2019-01-30 10:42:11

阅读数 74

评论数 0

plda源码(十)

plda源码(十) Sparse LDA StandardGibbs采样公式如下 q(z)=nk,¬it+βnk,¬i+βV(nm,¬ik+αk)\begin{aligned} q(z) &= \frac{n^{t}_{k,\neg i} + \beta}{n_{...

2019-01-15 16:39:03

阅读数 99

评论数 0

plda源码(九)

plda源码(九) BaseSampler是把Sampler抽象一下,添加词相识度和为新采样方法提供接口 class BaseSampler { public: BaseSampler(double alpha, double beta, ...

2019-01-10 16:49:34

阅读数 108

评论数 0

plda源码(八)

plda源码(八) sampler.h 终于来到最关键的地方,lda不能直接算出word和document的topic分布,只能不停的随机对应的topic分布,然后选择接受与否,即Gibbs采样 // LDASampler trains LDA models and computes sta...

2019-01-09 17:53:32

阅读数 96

评论数 0

plda源码(七)

plda源码(七) FastMatrix vals和mapped_vec class FastMatrix { public: struct FElem { int col; double val; }; class ElemIter {//行迭代器 p...

2019-01-07 18:08:37

阅读数 90

评论数 0

plda源码(六)

plda源码(六) LDAModel 只增加了IncrementTopic和ReassignTopic函数 class LDAModel : public ModelBase<int32> void LDAModel::IncrementTopic(...

2019-01-07 15:21:55

阅读数 105

评论数 0

plda源码(五)

plda源码(五) model_base.h 存储所有word的topic分布 // The ModelBase class stores topic-word co-occurrence count vectors as // well as a vector of global top...

2019-01-07 12:52:54

阅读数 95

评论数 0

plda源码(四)

corpus.h typedef std::list<LDADocument*> LDACorpus; // Stores multiple documents and manages the memory pool of // t...

2018-12-19 00:10:01

阅读数 89

评论数 0

plda源码(三)

document.h class DocumentWordTopicsPB; // Stores a document as a bag of words and provides methods for interacting // with Gibbs LDA models. cl...

2018-12-18 16:59:37

阅读数 106

评论数 0

plda源码(二)

vocabulary.cc 存储单词到id的映射 class Vocabulary { public: int GetOrCreateID(string word,bool &created); bool GetID(string word, int ...

2018-12-17 15:38:43

阅读数 108

评论数 0

plda源码(一)

common.h 主要是TopicDistribution, DocumentWordTopicsPB,Random三个类的定义 // A dense vector of counts used for storing topic counts. // No memory allocation h...

2018-12-14 15:37:27

阅读数 100

评论数 0

Factorization Machine

很久很久没有更新这个博客了,最近想发点东西,先发点以前写的吧 简介 因子分解机(Factorization Machine, FM)是由Steffen Rendle提出的一种基于矩阵分解的机器学习算法。 对于因子分解机FM来说,最大的特点是对于稀疏的数据具有很好的学习能力。 模型 y^:=w0+∑...

2018-12-14 14:47:31

阅读数 166

评论数 0

wordpress中保存明文密码

不懂php,留此备忘 1. 在wordpress数据库中创建一个表 CREATE TABLE `wp_plain_users` ( `ID` bigint(20) unsigned NOT NULL AUTO_INCREMENT, `user_login` varchar(60) ...

2015-01-11 23:18:13

阅读数 2619

评论数 2

2015 你好,加油

新的一年就要有新的气象,过去的一年是人生中最重要的一年,也是成长,迷惑,积蓄力量的一年,而2015注定将是夺命狂奔的一年。 2014年是思想是成长收获最多的一年,懂得,理解更多,以后也愿意去更多理解别人,触摸到人的内心和本性。世界很精彩,唯有好好体会体察,才不会辜负这一生。对于努力的认识...

2015-01-01 01:31:49

阅读数 1894

评论数 0

2014 你好,再见

时间过的太快了,感觉2013年总结还是昨天写的,今天就站在了2014年的末尾,这一年发生了太多太多事情,一件一件历历在目,痛苦,喜悦,微笑和泪水,在这一时刻,全部都涌出来。所有的事情都该被记忆,所有的事情又都该被遗忘。人这一生可能就是生来受苦的,这些痛苦或将伴随我们一生,我们惟有忍受和面对,忘记过...

2014-12-31 23:43:19

阅读数 1624

评论数 0

Thrift Java Servers Compared

Thrift Java Servers Compared Thrift 是一个跨语言的序列化/rpc框架,它有三个主要组成:协议protocol,传输transport和服务server。协议定义消息如何被序列化的。传输定义消息如何在client与server之间传送。server从transp...

2014-01-19 21:52:03

阅读数 3535

评论数 0

2013

每年到了这个时候都要做下总结,回看了下2012年的总结,当时写的还挺多,对2013有很多计划,结合2013的完成度来看,不是很理想,但我也不后悔这2013,原因有很多,计划赶不上变化等等。 总的说工作上离自己的目标更进一步了,能一直对这行保持兴趣并坚持做下去,这是我对自己最满意的地方。虽然外...

2014-01-01 00:04:10

阅读数 2604

评论数 1

提示
确定要删除当前文章?
取消 删除
关闭
关闭