2016年11月_-柚子皮-

12月 11月 10月 09月 08月 07月 06月 05月 04月 03月 02月 01月

原创 python模块：网络协议和支持

python模块：网络协议和支持 webbrowser调用浏览器显示html文件webbrowser.open('map.html')[webbrowser — Convenient Web-browser controller]皮皮bloguuid/hmac/hashlib生成唯一ID在有些情况下你需要生成一个唯一的字符串。我看到很多人使用md5()函数来达

2016-11-30 16:55:38 2390

原创 Matplotlib Toolkits：地图绘制工具

httpMatplotlib Toolkits：地图绘制工具 Basemap(Not distributed with matplotlib，要手动安装)Plots data on map projections, with continental and political boundaries, see basemap docs.安装先下载anaconda

2016-11-30 10:29:35 10841 1

原创 Matplotlib Toolkits：python高级绘图库seaborn

http://blog.csdn.net/pipisorry/article/details/49515745Seaborn介绍seaborn(Not distributed with matplotlib)seaborn is a highlevel interface for drawing statistical graphics with matplotlib. Itaims to mak

2016-11-25 22:51:55 16746

原创信息论：熵与互信息

熵/信息熵http://这篇文章主要讲：熵, 联合熵(joint entropy),条件熵(conditional entropy),相对熵(relative entropy,KL 距离),互信息(mutual information),交叉熵(cross entropy),困惑度(perplexity)。熵/信息熵在信息论中，熵是接收的每条消息中包含的信息的平均量，又被称为信息熵、信源熵、平均自信息量。这里，消息代表来自分布或数据流中的事件、样本或特征。

2016-11-25 21:18:43 92732 15

原创 Scikit-learn：最近邻搜索sklearn.neighbors

http://blog.csdn.net/pipisorry/article/details/53156836ball treek-d tree也有问题[最近邻查找算法kd-tree ]。矩形并不是用到这里最好的方式。偏斜的数据集会造成我们想要保持树的平衡与保持区域的正方形特性的冲突。另外，矩形甚至是正方形并不是用在这里最完美的形状，由于它的角。如果图6中的圆

2016-11-25 16:01:14 25037 5

原创 Spark：聚类算法

Spark：聚类算法 Kmeans聚类KMeans算法的基本思想是初始随机给定K个簇中心，按照最邻近原则把待分类样本点分到各个簇。然后按平均法重新计算各个簇的质心，从而确定新的簇心。一直迭代，直到簇心的移动距离小于某个给定的值。K-Means聚类算法主要分为三个步骤：(1)第一步是为待聚类的点寻找聚类中心(2)第二步是计算每个点到聚类中心的距离，将每个点聚类到

2016-11-25 15:35:15 7298

原创 Spark：Spark 编程模型及快速入门

http://blog.csdn.net/pipisorry/article/details/52366356Spark编程模型SparkContext类和SparkConf类我们可通过如下方式调用 SparkContext 的简单构造函数,以默认的参数值来创建相应的对象。val sc = new SparkContext("local[4]", "Test Spark App")这段代码会创建一

2016-11-25 10:25:08 7134

原创 Scikit-learn：聚类clustering

http://blog.csdn.net/pipisorry/article/details/53185758不同聚类效果比较sklearn不同聚类示例比较A comparison of the clustering algorithms in scikit-learn不同聚类综述Method nameParametersScalabilityUsecaseGeometry (metric use

2016-11-25 09:22:38 7659 1

原创 Spark核心类：SQLContext和DataFrame

http://blog.csdn.net/pipisorry/article/details/53320669pyspark.sql.SQLContext[pyspark.sql.SQLContext]皮皮blogpyspark.sql.DataFramespark df和pandas dfspark df的操作基本和pandas df操作一样的[Pandas小记(6)

2016-11-24 15:28:41 11360

原创 Spark核心类：弹性分布式数据集RDD及其转换和操作pyspark.RDD

http://blog.csdn.net/pipisorry/article/details/53257188弹性分布式数据集RDD(Resilient Distributed Dataset)创建RDD并行集合 (Parallelized collections)RDD可从现有的集合创建。比如在Scala shell中:val collection = List("a", "b", "c", "

2016-11-21 11:02:26 8630

原创 Java：接口interface

http://blog.csdn.net/pipisorry/article/details/53116829接口（interface）：命名规则与类一样采用大驼峰命名法，多以大写的I（interface缩写）开头或者able或ible结尾，如interface Runnable ;interface Accessible 。简单地说：接口的作用就是把使用接口的人和实现接口的人分开，实现接...

2016-11-10 16:17:58 1120

原创 python模块：时间处理模块

http://blog.csdn.net/pipisorry/article/details/53067168常用python自带时间处理模块python自带的时间处理模块参考[操作系统服务：time时间模块+datetime模块 ]有一些情况下，datetime却并没有那么好用。比如：1.创建日期时间范围2.创建未固定的日期时间3.检验两个日期时间的差值是否

2016-11-07 16:30:32 6800

原创 python命令行参数解析模块argparse和docopt

http://blog.csdn.net/pipisorry/article/details/53046471直接的命令行参数读取$ python test.py arg1 arg2 arg3Python 中也可以所用sys的sys.argv来获取命令行参数： sys.argv 是命令行参数列表。 len(sys.argv) 是命令行参数个数。注：sys....

2016-11-05 20:08:55 13023

原创 Scikit-learn：分类classification

http://blog.csdn.net/pipisorry/article/details/53034340支持向量机SVM分类svm分类有多种不同的算法。svcImplementation of Support Vector Machine classifier using libsvm: the kernel can be non-linear but its SMO algorithm d

2016-11-04 14:38:13 3015

原创 Scikit-learn：模型评估Model evaluation 之绘图

http://blog.csdn.net/pipisorry/article/details/53001866绘制ROC曲线def plotRUC(yt, ys, title=None): ''' 绘制ROC-AUC曲线 :param yt: y真值 :param ys: y预测值 ''' from sklearn import metrics

2016-11-02 10:31:28 2893

Parameter estimation for text analysis

Parameter estimation for text analysis Gregor Heinrich Parameter estimation for text analysis Gregor Heinrich Parameter estimation for text analysis Gregor Heinrich Parameter estimation for text analysis Gregor Heinrich Parameter estimation for text analysis Gregor Heinrich Parameter estimation for text analysis Gregor Heinrich

2016-05-23

pdfstudio安装文件及破解

pdfstudio v9版本及其破解jar pdfstudio v9版本及其破解jar pdfstudio v9版本及其破解jar pdfstudio v9版本及其破解jar pdfstudio v9版本及其破解jar

2016-03-24

spark机器学习示例代码

spark机器学习示例代码 machine learning with spark

2016-03-06

偏置方差分解推导

偏置方差分解 Bias-variance decompose

2016-02-05

Bias-variance decomposition推导

Bias-variance decomposition 偏置方差分解推导

2016-02-05

milk安装包

milk 安装包 win7 64位 python2

2016-01-02

python2 scipy安装包

scipy 安装包 win7 64位 python2.exe

2016-01-02

pywin32 py2安装包

scikit-learn 安装包 win7 64位 python2

2016-01-02

scikit learn py2安装包

scikit-learn 安装包 win7 64位 python2

2016-01-02

matplotlib安装包

matplotlib安装文件 win7 64位 python2 包含matplotlib.exe安装文件及其依赖包（pyparsing，dateutil等等）先安装依赖包，再安装matplotlib.exe文件

2016-01-02

python pip安装包

python pip 安装包 win7 64位 python2

2016-01-02

numpy安装包

numpy 安装包 win7 64位 python2

2016-01-02

scipy安装包

scipy 安装包 win7 64位 python3

2016-01-02

scikit learn安装包

scikit-learn 安装包 win7 64位 python3

2016-01-01

PyQt5安装包

PyQt5 安装包 win7 64位 python3

2016-01-01

pandas安装文件

pandas-0.16.0-cp34-none-win_amd64.whl安装包 win7 64位 python3拓展安装包提示：安装whl文件方法 1>打开python，在python命令行中输入(如果提示install错误，见2>) pip install ****.whl 2>直接在cmd中输入上面的安装命令

2016-01-01

matplotlib安装文件

matplotlib安装文件 win7 64位 python3 包含matplotlib.exe安装文件及其依赖包（pyparsing，dateutil等等）先安装依赖包，再安装matplotlib.exe文件

2016-01-01

SnapShot4.4.exe

QQ2015 截图工具可以截取弹窗可以保存完全如同打开QQ后的截图一样

2015-09-03

get-pip.py

python pip安装程序

2015-08-12

GB2UTF8.exe

GB2UTF8.exe utf8 gbk big5三向转换，方便您将文本文件转换到需要的格式。 utf8 gbk big5三向转换，方便您将文本文件转换到需要的格式。 utf8 gbk big5三向转换，方便您将文本文件转换到需要的格式。

2015-08-07

主题挖掘测试数据

2015-06-03

Introduction to Computation and Programming Using Python

2015-05-03

A First Course in Probability 第8版 Sheldon Ross

A First Course in Probability 第8版英文版 Sheldon Ross 概率论基础教程第8版 Sheldon Ross A First Course in Probability 第8版英文版 Sheldon Ross 概率论基础教程第8版 Sheldon Ross A First Course in Probability 第8版英文版 Sheldon Ross 概率论基础教程第8版 Sheldon Ross A First Course in Probability 第8版英文版 Sheldon Ross 概率论基础教程第8版 Sheldon Ross A First Course in Probability 第8版英文版 Sheldon Ross 概率论基础教程第8版 Sheldon Ross A First Course in Probability 第8版英文版 Sheldon Ross 概率论基础教程第8版 Sheldon Ross

2014-10-31

GAME THEORY-Thomas

2014-09-13

组合博弈入门.ppt

2014-09-13

noi2002测试数据

2014-09-13

NOI2012测试数据

2014-09-13

NOI2011测试数据

2014-09-13

noi2010测试数据

2014-09-13

noi2009测试数据

2014-09-13

noi2008测试数据

2014-09-13

技术之瞳-阿里巴巴技术笔试心得文字版pdf

技术之瞳-阿里巴巴技术笔试心得完整文字版pdf

2017-04-21

wps symbol fonts

wps symbol font WPS for Linux 字体缺失的解决办法启动WPS for Linux后，出现提示"系统缺失字体" 。出现提示的原因是因为WPS for Linux没有自带windows的字体，只要在Linux系统中加载字体即可。具体操作步骤如下： 1. 下载缺失的字体文件，然后复制到Linux系统中的/usr/share/fonts文件夹中。下载完成后，解压并进入目录中，继续执行： sudo cp * /usr/share/fonts 2. 执行以下命令,生成字体的索引信息： sudo mkfontscale sudo mkfontdir 3. 运行fc-cache命令更新字体缓存。 sudo fc-cache 4. 重启wps即可，字体缺失的提示不再出现。

2017-02-27

Structured PCA

Structured Principal Component Analysis, Structured PCA

2016-08-02

PCAS示例代码

PCAS 示例代码 PlaneParts showpcs

2016-08-01

KcoreVertex

KcoreVertex c++代码 graphlite+hadoop实现

2016-06-10

avg-time hadoop程序

2016-06-10

Anand.Rajaraman-Mining of Massive Datasets

Anand.Rajaraman-Mining of Massive Datasets-mmds 完整带书签文字版 Anand.Rajaraman-Mining of Massive Datasets-mmds 完整带书签文字版 Anand.Rajaraman-Mining of Massive Datasets-mmds 完整带书签文字版 Anand.Rajaraman-Mining of Massive Datasets-mmds 完整带书签文字版 Anand.Rajaraman-Mining of Massive Datasets-mmds 完整带书签文字版

2016-06-01

GIBBS SAMPLING FOR THE UNINITIATED

Philip Resnik-GIBBS SAMPLING FOR THE UNINITIATED

2016-05-30

概率图模型原理与技术科勒清华大学完整版

2016-05-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

Parameter estimation for text analysis

pdfstudio安装文件及破解

spark机器学习示例代码

偏置方差分解推导

Bias-variance decomposition推导

milk安装包

python2 scipy安装包

pywin32 py2安装包

scikit learn py2安装包

matplotlib安装包

python pip安装包

numpy安装包

scipy安装包

scikit learn安装包

PyQt5安装包

pandas安装文件

matplotlib安装文件

SnapShot4.4.exe

get-pip.py

GB2UTF8.exe

主题挖掘测试数据

Introduction to Computation and Programming Using Python

A First Course in Probability 第8版 Sheldon Ross

GAME THEORY-Thomas

组合博弈入门.ppt

noi2002测试数据

NOI2012测试数据

NOI2011测试数据

noi2010测试数据

noi2009测试数据

noi2008测试数据

技术之瞳-阿里巴巴技术笔试心得 文字版pdf

wps symbol fonts

Structured PCA

PCAS示例代码

KcoreVertex

avg-time hadoop程序

Anand.Rajaraman-Mining of Massive Datasets

GIBBS SAMPLING FOR THE UNINITIATED

概率图模型 原理与技术 科勒 清华大学 完整版

空空如也

技术之瞳-阿里巴巴技术笔试心得文字版pdf

概率图模型原理与技术科勒清华大学完整版