- 博客(15)
- 资源 (104)
- 收藏
- 关注
原创 python模块:网络协议和支持
python模块:网络协议和支持 webbrowser调用浏览器显示html文件webbrowser.open('map.html')[webbrowser — Convenient Web-browser controller]皮皮bloguuid/hmac/hashlib生成唯一ID在有些情况下你需要生成一个唯一的字符串。我看到很多人使用md5()函数来达
2016-11-30 16:55:38 2390
原创 Matplotlib Toolkits:地图绘制工具
httpMatplotlib Toolkits:地图绘制工具 Basemap(Not distributed with matplotlib,要手动安装)Plots data on map projections, with continental and political boundaries, see basemap docs.安装先下载anaconda
2016-11-30 10:29:35 10841 1
原创 Matplotlib Toolkits:python高级绘图库seaborn
http://blog.csdn.net/pipisorry/article/details/49515745Seaborn介绍seaborn(Not distributed with matplotlib)seaborn is a highlevel interface for drawing statistical graphics with matplotlib. Itaims to mak
2016-11-25 22:51:55 16746
原创 信息论:熵与互信息
熵/信息熵http://这篇文章主要讲:熵, 联合熵(joint entropy),条件熵(conditional entropy),相对熵(relative entropy,KL 距离),互信息(mutual information),交叉熵(cross entropy),困惑度(perplexity)。熵/信息熵在信息论中,熵是接收的每条消息中包含的信息的平均量,又被称为信息熵、信源熵、平均自信息量。这里, 消息代表来自分布或数据流中的事件、样本或特征。
2016-11-25 21:18:43 92732 15
原创 Scikit-learn:最近邻搜索sklearn.neighbors
http://blog.csdn.net/pipisorry/article/details/53156836ball treek-d tree也有问题[最近邻查找算法kd-tree ]。矩形并不是用到这里最好的方式。偏斜的数据集会造成我们想要保持树的平衡与保持区域的正方形特性的冲突。另外,矩形甚至是正方形并不是用在这里最完美的形状,由于它的角。如果图6中的圆
2016-11-25 16:01:14 25037 5
原创 Spark:聚类算法
Spark:聚类算法 Kmeans聚类KMeans算法的基本思想是初始随机给定K个簇中心,按照最邻近原则把待分类样本点分到各个簇。然后按平均法重新计算各个簇的质心,从而确定新的簇心。一直迭代,直到簇心的移动距离小于某个给定的值。K-Means聚类算法主要分为三个步骤:(1)第一步是为待聚类的点寻找聚类中心(2)第二步是计算每个点到聚类中心的距离,将每个点聚类到
2016-11-25 15:35:15 7298
原创 Spark:Spark 编程模型及快速入门
http://blog.csdn.net/pipisorry/article/details/52366356Spark编程模型SparkContext类和SparkConf类我们可通过如下方式调用 SparkContext 的简单构造函数,以默认的参数值来创建相应的对象。val sc = new SparkContext("local[4]", "Test Spark App")这段代码会创建一
2016-11-25 10:25:08 7134
原创 Scikit-learn:聚类clustering
http://blog.csdn.net/pipisorry/article/details/53185758不同聚类效果比较sklearn不同聚类示例比较A comparison of the clustering algorithms in scikit-learn不同聚类综述Method nameParametersScalabilityUsecaseGeometry (metric use
2016-11-25 09:22:38 7659 1
原创 Spark核心类:SQLContext和DataFrame
http://blog.csdn.net/pipisorry/article/details/53320669pyspark.sql.SQLContext[pyspark.sql.SQLContext]皮皮blogpyspark.sql.DataFramespark df和pandas dfspark df的操作基本和pandas df操作一样的[Pandas小记(6)
2016-11-24 15:28:41 11360
原创 Spark核心类:弹性分布式数据集RDD及其转换和操作pyspark.RDD
http://blog.csdn.net/pipisorry/article/details/53257188弹性分布式数据集RDD(Resilient Distributed Dataset)创建RDD并行集合 (Parallelized collections)RDD可从现有的集合创建。比如在Scala shell中:val collection = List("a", "b", "c", "
2016-11-21 11:02:26 8630
原创 Java:接口interface
http://blog.csdn.net/pipisorry/article/details/53116829接口(interface):命名规则与类一样采用大驼峰命名法,多以大写的I(interface缩写)开头或者able或ible结尾,如interface Runnable ;interface Accessible 。简单地说:接口的作用就是把使用接口的人和实现接口的人分开,实现接...
2016-11-10 16:17:58 1120
原创 python模块:时间处理模块
http://blog.csdn.net/pipisorry/article/details/53067168常用python自带时间处理模块python自带的时间处理模块参考[操作系统服务:time时间模块+datetime模块 ]有一些情况下,datetime却并没有那么好用。比如:1.创建日期时间范围2.创建未固定的日期时间3.检验两个日期时间的差值是否
2016-11-07 16:30:32 6800
原创 python命令行参数解析模块argparse和docopt
http://blog.csdn.net/pipisorry/article/details/53046471直接的命令行参数读取$ python test.py arg1 arg2 arg3Python 中也可以所用sys的sys.argv来获取命令行参数: sys.argv 是命令行参数列表。 len(sys.argv) 是命令行参数个数。 注:sys....
2016-11-05 20:08:55 13023
原创 Scikit-learn:分类classification
http://blog.csdn.net/pipisorry/article/details/53034340支持向量机SVM分类svm分类有多种不同的算法。svcImplementation of Support Vector Machine classifier using libsvm: the kernel can be non-linear but its SMO algorithm d
2016-11-04 14:38:13 3015
原创 Scikit-learn:模型评估Model evaluation 之绘图
http://blog.csdn.net/pipisorry/article/details/53001866绘制ROC曲线def plotRUC(yt, ys, title=None): ''' 绘制ROC-AUC曲线 :param yt: y真值 :param ys: y预测值 ''' from sklearn import metrics
2016-11-02 10:31:28 2893
Parameter estimation for text analysis
2016-05-23
pdfstudio安装文件及破解
2016-03-24
matplotlib安装包
2016-01-02
pandas安装文件
2016-01-01
matplotlib安装文件
2016-01-01
GB2UTF8.exe
2015-08-07
Introduction to Computation and Programming Using Python
2015-05-03
A First Course in Probability 第8版 Sheldon Ross
2014-10-31
wps symbol fonts
2017-02-27
Anand.Rajaraman-Mining of Massive Datasets
2016-06-01
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人