2015年01月_-柚子皮-

12月 11月 10月 09月 08月 07月 06月 05月 04月 03月 02月 01月

原创 python模块导入及属性：import

http://blog.csdn.net/pipisorry/article/details/43313197模块和包1. python程序由包（package）、模块（module）和函数组成。2. 包是由一系列模块组成的集合。当不同作的模块进行按文件夹分类后再组成一个整体的库，可以称为包。为了让Python将目录当做内容包，目录中必须包含__init__.py文件，用于标识当前文件...

2015-01-30 20:39:45 38269 2

原创 Java字符串操作及处理

Java字符串操作http://Java字符串操作。

2015-01-30 09:57:01 4448 2

原创 Scipy教程 - 线性代数库scipy.linalg

http://blog.csdn.net/pipisorry/article/details/43277755Linear Algebra(scipy.linalg) scipy线性代数库简介When SciPy is built using the optimized ATLAS LAPACK and BLAS libraries, it has very fast linear

2015-01-29 20:49:58 34505

原创 knowledge_based topic model - AMC

http://blog.csdn.net/pipisorry/article/details/43271429ABSTRACT Topic modeling has been widely used to mine topics from documents. However,a key weakness of topic modeling is that it

2015-01-29 14:59:28 3033 1

原创 Linux：shell变量功能和Bash shell的操作环境

http://blog.csdn.net/pipisorry/article/details/43235263shell的变量功能sh和bash命令两者都是shell，都是解析工具。bash（Bourne Again SHell）是Linux标准的默认shell ，它基于Bourne shell，吸收了C shell和Korn shell的一些特性。sh（Bourne she...

2015-01-28 19:07:16 4598

原创 Machine Learning - II. Linear Regression with One Variable单变量线性回归 (Week 1)

http://blog.csdn.net/pipisorry/article/details/43115525机器学习Machine Learning - Andrew NG courses学习笔记Linear regression with one variable单变量线性回归模型表示Model representation例子：这是Regression Problem（one of supe

2015-01-25 17:50:22 3500

原创 Machine Learning - I. Introduction机器学习综述 (Week 1)

机器学习的来源和用例：Machine Learning- Grew out of work in AI- New capability for computersExamples:- Database miningLarge datasets from growth of automation/web.E.g., Web click data, medical re

2015-01-24 20:35:41 4868

原创 Stanford Parser的使用——进行词法语法分析

http://blog.csdn.net/pipisorry/article/details/42976457stanford-parser的使用1、到斯坦福官方网站http://nlp.stanford.edu/software/lex-parser.shtml下载软件包，解压。2、在eclipse中新建一个java project，把解压得到根目录下的sta

2015-01-21 20:44:01 23658

原创 Java集合操作Collections

list操作List 转成 Set

2015-01-21 11:04:28 53096 2

原创 java环境配置：安装java和集成开发环境idea

http://Java是由Sun公司开发的一种应用于分布式网络环境的程序设计语言，Java语言拥有跨平台的特性，它编译的程序能够运行在多种操作系统平台上，可以实现“一次编写，到处运行”的强大功能。

2015-01-20 15:45:32 6619 1

原创 python堆实现

heapify。

2015-01-20 14:42:01 3342

原创 todotodo

http://blog.csdn.net/pipisorry/article/details/42913673from:ref:

2015-01-20 10:12:33 2888

原创 Java爬虫Crawler

缺少某个库，找到之后，需要将该库，jar包，加入到当前项目，使得代码中的import xxx得以正常导入。通过 Add External Achieves…的方式导入的。具体操作起来，有很多种方式：（1）最快捷的是：右键项目->Build Path -> Add External Achieves…举例：然后选择，单个或多个的，对应的库（jar包）：再点击确

2015-01-20 09:36:03 1950

原创打印机共享

http://blog.csdn.net/pipisorry/article/details/42778163本文主要说明在win7, win8, win10, linux(ubuntu)怎么在局域网及广域网上设置打印机远程共享。连接打印机电脑的主机上的设置(for win7&win8)(这个是连接打印机的电脑的设置。win10未测试，应该一样； linux也未测试)取消默认禁用的Guest用户W

2015-01-16 16:14:57 4387 1

原创概率论：p(x|theta)和p(x;theta)的区别

http://blog.csdn.net/pipisorry/article/details/42715245求解最大似然估计时发现有两种表示方法 from:Gregor Heinrich - Parameter estimation for text analysisfrom:http://blog.csdn.net/pipisorry/article

2015-01-14 20:19:25 21739

原创主题模型TopicModel：LDA中的数学模型

了解LDA需要明白如下数学原理：一个函数：gamma函数四个分布：二项分布、多项分布、beta分布、Dirichlet分布一个概念和一个理念：共轭先验和贝叶斯框架两个模型：pLSA、LDA（文档-主题，主题-词语）一个采样：Gibbs采样

2015-01-13 10:16:52 9066 3

原创主题模型TopicModel：隐含狄利克雷分布LDA

http://blog.csdn.net/pipisorry/article/details/42649657主题模型LDA简介隐含狄利克雷分布简称LDA(Latent Dirichlet allocation)，是一种主题模型，它可以将文档集中每篇文档的主题按照概率分布的形式给出。同时它是一种无监督学习算法，在训练时不需要手工标注的训练集，需要的仅仅是文档集以及指定主题的数量k即可。此外LDA的

2015-01-12 21:07:07 52343 13

原创主题模型TopicModel：PLSA模型及PLSA的EM推导

基于概率统计的PLSA模型，并且用EM算法学习模型参数。PLSA的概率图模型如下其中D代表文档，Z代表隐含类别或者主题，W为观察到的单词，表示单词出现在文档的概率，表示文档中出现主题下的单词的概率，给定主题出现单词的概率。并且每个主题在所有词项上服从Multinomial 分布，每个文档在所有主题上服从Multinomial 分布。整个文档的生成过程是这样的：(1) 以的概率选中文

2015-01-09 20:59:44 11052

原创主题模型TopicModel：Unigram、LSA、PLSA模型

http://blog.csdn.net/pipisorry/article/details/42560693主题模型历史Papadimitriou、Raghavan、Tamaki和Vempala在1998年发表的一篇论文中提出了潜在语义索引。1999年，Thomas Hofmann又在此基础上，提出了概率性潜在语义索引（Probabilistic Latent Semantic Inde...

2015-01-09 20:49:55 26773 11

原创主题模型TopicModel：LSA（隐性语义分析）模型和其实现的早期方法SVD

LSA and SVDLSA(隐性语义分析)的目的是要从文本中发现隐含的语义维度-即“Topic”或者“Concept”。我们知道，在文档的空间向量模型（VSM）中，文档被表示成由特征词出现概率组成的多维向量，这种方法的好处是可以将query和文档转化成同一空间下的向量计算相似度，可以对不同词项赋予不同的权重，在文本检索、分类、聚类问题中都得到了广泛应用，在基于贝叶斯算法及KNN算法的ne

2015-01-09 20:40:55 17562 3

原创 EM算法原理详解

http://blog.csdn.net/pipisorry/article/details/42550815EM算法有很多的应用，最广泛的就是GMM混合高斯模型、聚类、HMM、基于概率的PLSA模型等等。本文详细讲述EM算法的由来、EM算法的实现思路、EM算法解决PLSA和LDA的方法。概述、EM是一种解决存在隐含变量优化问题的有效方法。EM的意思是“Expectation Maximizati

2015-01-09 09:44:36 50058 8

原创字符编码ASCII，Unicode和UTF-8

http://blog.csdn.net/pipisorry/article/details/42387045字符编码介绍文本，他们通常指显示在屏幕上的字符或者其他的记号；但是计算机不能直接处理这些字符和标记；它们只认识位(bit)和字节(byte)。实际上，从屏幕上的每一块文本都是以某种字符编码(character encoding)的方式保存的。粗略地说就是，字符编码提供一种映射，使屏幕上显示

2015-01-08 15:50:03 5541

原创主题模型TopicModel：LDA主题模型的评估

LDA主题模型好坏的评估，判断改进的参数或者算法的建模能力。Blei先生在论文《Latent Dirichlet Allocation》实验中用的是Perplexity值作为评判标准。一、Perplexity定义http://en.wikipedia.org/wiki/Perplexityperplexity是一种信息理论的测量方法，b的perplexity值定义为基于b的

2015-01-06 17:05:04 31180

原创正则表达式

正则表达式是用于处理字符串的强大工具，拥有自己独特的语法以及一个独立的处理引擎，效率上可能不如str自带的方法，但功能十分强大。在提供了正则表达式的语言里，正则表达式的语法都是一样的，区别只在于不同的编程语言实现支持的语法数量不同；但不用担心，不被支持的语法通常是不常用的部分。

2015-01-04 10:00:58 3355 1

Parameter estimation for text analysis

Parameter estimation for text analysis Gregor Heinrich Parameter estimation for text analysis Gregor Heinrich Parameter estimation for text analysis Gregor Heinrich Parameter estimation for text analysis Gregor Heinrich Parameter estimation for text analysis Gregor Heinrich Parameter estimation for text analysis Gregor Heinrich

2016-05-23

pdfstudio安装文件及破解

pdfstudio v9版本及其破解jar pdfstudio v9版本及其破解jar pdfstudio v9版本及其破解jar pdfstudio v9版本及其破解jar pdfstudio v9版本及其破解jar

2016-03-24

spark机器学习示例代码

spark机器学习示例代码 machine learning with spark

2016-03-06

偏置方差分解推导

偏置方差分解 Bias-variance decompose

2016-02-05

Bias-variance decomposition推导

Bias-variance decomposition 偏置方差分解推导

2016-02-05

milk安装包

milk 安装包 win7 64位 python2

2016-01-02

python2 scipy安装包

scipy 安装包 win7 64位 python2.exe

2016-01-02

pywin32 py2安装包

scikit-learn 安装包 win7 64位 python2

2016-01-02

scikit learn py2安装包

scikit-learn 安装包 win7 64位 python2

2016-01-02

matplotlib安装包

matplotlib安装文件 win7 64位 python2 包含matplotlib.exe安装文件及其依赖包（pyparsing，dateutil等等）先安装依赖包，再安装matplotlib.exe文件

2016-01-02

python pip安装包

python pip 安装包 win7 64位 python2

2016-01-02

numpy安装包

numpy 安装包 win7 64位 python2

2016-01-02

scipy安装包

scipy 安装包 win7 64位 python3

2016-01-02

scikit learn安装包

scikit-learn 安装包 win7 64位 python3

2016-01-01

PyQt5安装包

PyQt5 安装包 win7 64位 python3

2016-01-01

pandas安装文件

pandas-0.16.0-cp34-none-win_amd64.whl安装包 win7 64位 python3拓展安装包提示：安装whl文件方法 1>打开python，在python命令行中输入(如果提示install错误，见2>) pip install ****.whl 2>直接在cmd中输入上面的安装命令

2016-01-01

matplotlib安装文件

matplotlib安装文件 win7 64位 python3 包含matplotlib.exe安装文件及其依赖包（pyparsing，dateutil等等）先安装依赖包，再安装matplotlib.exe文件

2016-01-01

SnapShot4.4.exe

QQ2015 截图工具可以截取弹窗可以保存完全如同打开QQ后的截图一样

2015-09-03

get-pip.py

python pip安装程序

2015-08-12

GB2UTF8.exe

GB2UTF8.exe utf8 gbk big5三向转换，方便您将文本文件转换到需要的格式。 utf8 gbk big5三向转换，方便您将文本文件转换到需要的格式。 utf8 gbk big5三向转换，方便您将文本文件转换到需要的格式。

2015-08-07

主题挖掘测试数据

2015-06-03

A First Course in Probability 第8版 Sheldon Ross

A First Course in Probability 第8版英文版 Sheldon Ross 概率论基础教程第8版 Sheldon Ross A First Course in Probability 第8版英文版 Sheldon Ross 概率论基础教程第8版 Sheldon Ross A First Course in Probability 第8版英文版 Sheldon Ross 概率论基础教程第8版 Sheldon Ross A First Course in Probability 第8版英文版 Sheldon Ross 概率论基础教程第8版 Sheldon Ross A First Course in Probability 第8版英文版 Sheldon Ross 概率论基础教程第8版 Sheldon Ross A First Course in Probability 第8版英文版 Sheldon Ross 概率论基础教程第8版 Sheldon Ross

2014-10-31

GAME THEORY-Thomas

2014-09-13

组合博弈入门.ppt

2014-09-13

noi2002测试数据

2014-09-13

NOI2012测试数据

2014-09-13

NOI2011测试数据

2014-09-13

noi2010测试数据

2014-09-13

noi2009测试数据

2014-09-13

noi2008测试数据

2014-09-13

noi2007测试数据

2014-09-13

noi2006测试数据

2014-09-13

wps symbol fonts

wps symbol font WPS for Linux 字体缺失的解决办法启动WPS for Linux后，出现提示"系统缺失字体" 。出现提示的原因是因为WPS for Linux没有自带windows的字体，只要在Linux系统中加载字体即可。具体操作步骤如下： 1. 下载缺失的字体文件，然后复制到Linux系统中的/usr/share/fonts文件夹中。下载完成后，解压并进入目录中，继续执行： sudo cp * /usr/share/fonts 2. 执行以下命令,生成字体的索引信息： sudo mkfontscale sudo mkfontdir 3. 运行fc-cache命令更新字体缓存。 sudo fc-cache 4. 重启wps即可，字体缺失的提示不再出现。

2017-02-27

Structured PCA

Structured Principal Component Analysis, Structured PCA

2016-08-02

PCAS示例代码

PCAS 示例代码 PlaneParts showpcs

2016-08-01

KcoreVertex

KcoreVertex c++代码 graphlite+hadoop实现

2016-06-10

avg-time hadoop程序

2016-06-10

Anand.Rajaraman-Mining of Massive Datasets

Anand.Rajaraman-Mining of Massive Datasets-mmds 完整带书签文字版 Anand.Rajaraman-Mining of Massive Datasets-mmds 完整带书签文字版 Anand.Rajaraman-Mining of Massive Datasets-mmds 完整带书签文字版 Anand.Rajaraman-Mining of Massive Datasets-mmds 完整带书签文字版 Anand.Rajaraman-Mining of Massive Datasets-mmds 完整带书签文字版

2016-06-01

GIBBS SAMPLING FOR THE UNINITIATED

Philip Resnik-GIBBS SAMPLING FOR THE UNINITIATED

2016-05-30

概率图模型原理与技术科勒清华大学完整版

2016-05-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

Parameter estimation for text analysis

pdfstudio安装文件及破解

spark机器学习示例代码

偏置方差分解推导

Bias-variance decomposition推导

milk安装包

python2 scipy安装包

pywin32 py2安装包

scikit learn py2安装包

matplotlib安装包

python pip安装包

numpy安装包

scipy安装包

scikit learn安装包

PyQt5安装包

pandas安装文件

matplotlib安装文件

SnapShot4.4.exe

get-pip.py

GB2UTF8.exe

主题挖掘测试数据

A First Course in Probability 第8版 Sheldon Ross

GAME THEORY-Thomas

组合博弈入门.ppt

noi2002测试数据

NOI2012测试数据

NOI2011测试数据

noi2010测试数据

noi2009测试数据

noi2008测试数据

noi2007测试数据

noi2006测试数据

wps symbol fonts

Structured PCA

PCAS示例代码

KcoreVertex

avg-time hadoop程序

Anand.Rajaraman-Mining of Massive Datasets

GIBBS SAMPLING FOR THE UNINITIATED

概率图模型 原理与技术 科勒 清华大学 完整版

空空如也

概率图模型原理与技术科勒清华大学完整版