自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

皮皮blog

Talk is cheap, Show me the code!

  • 博客(683)
  • 资源 (104)
  • 收藏
  • 关注

原创 Linux:文件格式化与相关处理及sed工具

http://blog.csdn.net/pipisorry/article/details/52564957geditor, sed, ed, awk, Emacs文本处理工具[Linux Shell 文本处理工具集锦]geditor最常用的类似windows下的记事本ubuntu16.04 gedit乱码问题解决gsettings set org.gnome.ged...

2016-09-17 20:40:31 3398 1

原创 PGM:部分有向模型之条件随机场与链图模型

http://blog.csdn.net/pipisorry/article/details/52529287贝叶斯网与马尔可夫网[PGM:无向图模型:马尔可夫网 ]中例3.8和例4.8显示,贝叶斯网和马尔可夫网这两种表示独立性的语言没有可比性:每种表示都能表示另一种不能表示的独立性约束。这里更深入讨论两种表示间的联系。从贝叶斯网到到马尔可夫网d-分离的可靠性

2016-09-14 11:14:59 3606

原创 图论

http://blog.csdn.net/pipisorry/article/details/52518118最大团给定无向图G=(V,E),其中V是非空集合,称为顶点集;E是V中元素构成的无序二元组的集合,称为边集,无向图中的边均是顶点的无序对,无序对常用圆括号“( )”表示。完全子图complete subgraph如果U∈V,且对任意两个顶点u,v∈U有(u,v)∈E,则称U是G的完全子图。

2016-09-12 22:28:03 2637

原创 PGM:无向图模型:马尔可夫网(随机场)MRF

http://blog.csdn.net/pipisorry/article/details/52489321马尔可夫网皮皮blog无向图模型误解示例P-map不能构建贝叶斯网的一个示例x1表示这个学生对概念存在误解,x0表示没有。Note: 其中的bd其实只要给定c就是相互依赖了。[PGM:贝叶斯网络 ]误解示例的无向图模型解决

2016-09-12 22:27:54 13510 3

原创 PGM:有向图模型:贝叶斯网络

http://blog.csdn.net/pipisorry/article/details/52489270为什么用贝叶斯网络联合分布的显式表示Note: n个变量的联合分布,每个x对应两个值,共n个x,且所有概率总和为1,则联合分布需要2^n-1个参数。贝叶斯网表示独立性质的应用会降低参数数目,表达更紧凑。[PGM:贝叶斯网表示之朴素贝叶斯模型naive Bayes

2016-09-09 17:26:10 27884

原创 文件自动备份和同步bypy和syncthing

http://blog.csdn.net/pipisorry/article/details/52464402Linux定时备份数据到百度云盘 sudo pip3 install requestssudo pip3 install bypy备份脚本示例#!/bin/sh# File:    ~/bysync.sh# Author

2016-09-08 23:03:15 11994

原创 PGM:贝叶斯网表示之朴素贝叶斯模型naive Bayes

http://blog.csdn.net/pipisorry/article/details/52469064独立性质的利用条件参数化和条件独立性假设被结合在一起,目的是对高维概率分布产生非常紧凑的表示。随机变量的独立性[PGM:概率论基础知识 :独立性性质的利用]条件参数化方法Note: P(I), P(S | i0), P(S | i1)都是二项式分布,都

2016-09-08 11:06:01 4889 2

原创 PGM:概率论基础知识

http://blog.csdn.net/pipisorry/article/details/52459847概率图模型PGM:概率论基础知识独立性与条件独立性独立性条件独立性也就是表示给定 c 的条件下 a 与 b 条件独立,等价于公式p(a | b, c) = p(a | c)随机变量的独立性 等价于 条件独立性的性质这里是前面的独立性可以导出后面的独立性,而不是等价于后面的独立性。条件独立的

2016-09-07 15:20:48 2103

原创 操作系统服务:其它模块

http://blog.csdn.net/pipisorry/article/details/52454579IO模块16.2. io — Core tools for working with streams16.2.1. Overview16.2.1.1. Text I/O16.2.1.2. Binary I/O16.2.1.3. Raw I/O16.2.2. High-level Modul

2016-09-06 23:00:50 1121

原创 操作系统服务:OS模块

http://blog.csdn.net/pipisorry/article/details/52454486一般的操作系统服务之OS模块Generic Operating System Servicesos模块模块包含普遍的操作系统功能。利用这个模块可以写出与平台无关的程序,比如就是使用os.sep可以取代操作系统特定的路径分割符。os模块包含 Tasks Too...

2016-09-06 22:48:23 2271

原创 Spark运行架构

http://blog.csdn.net/pipisorry/article/details/523662881、 Spark运行架构1.1 术语定义lApplication:Spark Application的概念和Hadoop MapReduce中的类似,指的是用户编写的Spark应用程序,包含了一个Driver 功能的代码和分布在集群中多个节点上运行的Executor代码;lDriver:S

2016-08-30 09:17:19 2989

原创 Pycharm中进行Python远程开发

http://blog.csdn.net/pipisorry/article/details/52269952PyCharm提供两种远程调试(Remote Debugging)的方式:    配置远程的解释器(remote interpreter)    配置Python调试服务器(Python Debug Server)[配置Python调试服务器]本文主要说明远程的解释器(remote int

2016-08-22 10:26:45 59215 4

原创 Scikit-learn:模型选择之调参grid search

http://blog.csdn.net/pipisorry/article/details/52268947Scikit-learn:并行调参Grid SearchGrid Search: Searching for estimator parametersscikit-learn中提供了pipeline(for estimator connection) & grid_search(searc

2016-08-22 09:08:55 4582

原创 ssh用法及命令

http://blog.csdn.net/pipisorry/article/details/52269785什么是SSH?简单说,SSH是一种网络协议,用于计算机之间的加密登录。如果一个用户从本地计算机,使用SSH协议登录另一台远程计算机,我们就可以认为,这种登录是安全的,即使被中途截获,密码也不会泄露。最早的时候,互联网通信都是明文通信,一旦被截获,内容就暴露无疑。1995年,芬兰学者...

2016-08-21 22:15:43 502150 18

原创 Scikit-learn:scikit-learn快速教程及实例

http://blog.csdn.net/pipisorry/article/details/52251305scikit-learn 教程导航简介:使用scikit-learn进行机器学习 机器学习:问题设定加载样例数据集学习和预测模型持久化惯例 统计学习教程 统计学习:scikit-learn中的配置和estimator对象有监督学习:预测高维观测对象模型选择:选择estimator和参数无

2016-08-19 15:33:25 20247

原创 Scikit-learn:分类模型评估Model evaluation

http://blog.csdn.net/pipisorry/article/details/52250760模型评估Model evaluation: quantifying the quality of predictions3 different approaches to evaluate the quality of predictions of a model:Estimator sc...

2016-08-19 15:19:34 18957 1

原创 Scikit-learn:模型选择Model selection之pipline和交叉验证

http://blog.csdn.net/pipisorry/article/details/52250983选择合适的estimator通常机器学习最难的一部分是选择合适的estimator,不同的estimator适用于不同的数据集和问题。sklearn官方文档提供了一个图[flowchart],可以快速地根据你的数据和问题选择合适的estimator,单击相应的区域还可以获得...

2016-08-19 15:15:10 11183 2

原创 Scikit-learn:数据预处理Preprocessing data

http://blog.csdn.net/pipisorry/article/details/52247679 本blog内容有特征预处理(标准化、归一化、正则化、特征二值化、缺失值处理)和标签label预处理(label二值化、multi-label多值化)。特征的预处理基础知识参考[数据标准化/归一化normalization ][均值、方差与协方差矩阵 ]...

2016-08-19 10:25:26 28258 8

原创 Scikit-learn:主要模块和基本使用方法

http://blog.csdn.net/pipisorry/article/details/52128222scikit-learn: Machine Learning in Python.scikit-learn库实现了很多机器学习算法。scikit-learn是一个基于NumPy, SciPy, Matplotlib的开源机器学习工具包,主要涵盖分类,回归和聚类算法,例如SVM, 逻...

2016-08-19 10:22:28 9910

原创 数据标准化/归一化normalization

http://blog.csdn.net/pipisorry/article/details/52247379这里主要讲连续型特征归一化的常用方法。连续型特征还有一种处理方式是,先分桶/分箱(如等频/等距的分)[待写]进行离散化后再使用离散数据的处理方法。离散数据处理参考[数据预处理:独热编码(One-Hot Encoding)]。基础知识参考:[均值、方差与协方差矩阵][...

2016-08-19 09:42:40 439830 69

原创 未名

给blog留个空

2016-08-18 20:51:32 1207 1

原创 最优化方法:L1和L2正则化regularization

http://blog.csdn.net/pipisorry/article/details/52108040机器学习和深度学习常用的规则化方法之一:L范数正则化(规格化)。一般来说,监督学习可以看做最小化下面的目标函数):θ∗=arg⁡minθ1N∑i=1NL(yi,f(xi;θ))+λ 

2016-08-18 17:06:31 49453 6

原创 数值分析:矩阵求逆-奇异性、条件数

http://blog.csdn.net/pipisorry/article/details/52241141本blog主要内容有:矩阵的奇异性、条件数与病态矩阵、矩阵求逆。奇异矩阵和非奇异矩阵singular matrix&nonsingular matrix概念和定义若n阶矩阵A的行列式不为零,即 |A|≠0,则称A为非奇异矩阵或满秩矩阵,否则称A为奇异矩阵或降秩矩阵。奇异矩阵是线性代数的概念

2016-08-18 15:59:06 31875

原创 最优化方法:拉格朗日乘数法

解决约束优化问题——拉格朗日乘数法拉格朗日乘数法(Lagrange Multiplier Method)应用广泛,可以学习麻省理工学院的在线数学课程。1. 拉格朗日乘数法的基本思想  作为一种优化算法,拉格朗日乘子法主要用于解决约束优化问题,它的基本思想就是通过引入拉格朗日乘子来将含有n个变量和k个约束条件的约束优化问题转化为含有(n+k)个变量的无约束优化问题。拉格朗日乘子背后的数学意义是其为约

2016-08-18 14:34:38 63825 2

原创 最优化方法:深度学习最优化方法

http://blog.csdn.net/pipisorry/article/details/52135832深度学习最优化算法深度学习框架中常见的最优化方法,如tensorflow中的最优化方法及相关参数如下:tf.train.Optimizer tf.train.GradientDescentOptimizer tf.train.AdadeltaOptimizer tf.tr...

2016-08-18 14:33:32 11080 1

原创 统计处理包Statsmodels: statistics in python

StatsmodelsStatsmodels is a Python package that provides a complement to scipy for statistical computations including descriptive statistics and estimation of statistical models.statsmodels原名叫scikits.

2016-08-17 09:05:18 19046

原创 pandas小记:pandas时间序列分析和处理Timeseries

http://blog.csdn.net/pipisorry/article/details/52209377pandas 最基本的时间序列类型就是以时间戳(TimeStamp)为 index 元素的 Series 类型。其它时间序列处理相关的包[P4J 0.6: Periodic light curve analysis tools based on Information Theory][p4

2016-08-15 15:34:17 105341 1

原创 pandas小记:pandas数据输入输出

http://blog.csdn.net/pipisorry/article/details/52208727输出格式控制pandas dataframe数据全部输出,数据太多也不用省略号表示。pd.set_option('display.max_columns',None)或者with option_context('display.max_rows', 10, 'dis...

2016-08-15 10:12:28 41184

原创 python地理数据处理库geopy

python地理位置处理python地理编码地址以及用来处理经纬度的库GeoDjango – 世界级地理图形 web 框架。GeoIP – MaxMind GeoIP Legacy 数据库的Python API。geojson – GeoJSON 的 Python 绑定及工具。geopy – Python 地址编码工具箱。pygeoip – 纯 Python GeoIP API。django-co

2016-08-14 17:35:47 26666 2

原创 常用三角公式

基本公式两角和与差公式及规律二倍角公式及规律 半角公式三倍角公式积化和差与和差化积公式万能公式皮皮blog诱导公式同角三角函数基本关系皮皮blog应注意的问题1、两角差的余弦公式是本章中其余公式的基础,应记准该公式的形式. 2、倍角公式有升、降幂的功能,如果升幂,则角减半,如果降幂,则角加倍,根据条件灵活选用. 3、公式的“三用”(顺用、逆用、变用)是熟练进行三角变形的前提.3、整体原则-----

2016-08-13 17:22:46 4614 1

原创 微积分:常用公式、微分方程、级数

http://blog.csdn.net/pipisorry/article/details/52200140微积分一.基本初等函数求导公式函数的和、差、积、商的求导法则反函数求导法则复合函数求导法则皮皮blog二、基本积分表 皮皮blog常用凑微分公式[常用的求导和定积分公式(完美)]分部积分不定积分的分部积分设 及 是两个关于 的函数,各自具有连续导数 及 ,则按照乘积函数求微分法则,则

2016-08-13 17:03:32 299926 18

原创 最近邻查找算法kd-tree

http://blog.csdn.net/pipisorry/article/details/52186307海量数据最近邻查找的kd-tree简介        利用Octree,為封閉的3D空間建立一個資料結構來管理空間中的每個元素。如此我們可以在 O(log N) 的時間內對這3D空間進行搜尋。        3D空間可以用Octree,2D空間可以用Quadtree(四元樹,概...

2016-08-12 10:12:01 60414 6

原创 非负矩阵分解NMF

http://blog.csdn.net/pipisorry/article/details/52098864非负矩阵分解(NMF,Non-negative matrix factorization)NMF的发展及原理  著名的科学杂志《Nature》于1999年刊登了两位科学家D.D.Lee和H.S.Seung对数学中非负矩阵研究的突出成果。该文提出了一种新的矩阵分解思想——非负矩阵分解(Non

2016-08-03 12:37:26 83993 25

原创 Linux: Shell scripts

发个文艺点的博客。。。哈哈又是一个草长莺飞的季节,虽然有些寒冷又有些雨水,但是等待微风徐徐阳光暖人的初春总是一件让人快乐的事情!春天是一年中最好的赏花季节,桃花,杏花,樱花,梨花,李花,海棠花,这么多美丽的花,你还傻傻分不清吗?我们一起来认识一下吧!  手绘版  真图版  桃花  分辨要点:  1、单朵开放,花瓣略尖。  2、花期仲春,边开花边长叶。  3、颜色红润。  梅花  分辨要点:  1、

2016-07-06 10:09:42 4301

原创 numpy教程:排序、搜索和计数

http://blog.csdn.net/pipisorry/article/details/51822775numpy排序、搜索和计数函数和方法。(重新整合过的)排序Sortingsort(a[,axis,kind,order])Return a sorted copy of an array.lexsort(keys[,axis])Perform an indirect sort us...

2016-07-04 18:24:02 101639 3

原创 推荐系统:协同过滤collaborative filtering

http://blog.csdn.net/pipisorry/article/details/51788955(个性化)推荐系统构建三大方法:基于内容的推荐content-based,协同过滤collaborative filtering,隐语义模型(LFM, latent factor model)推荐。这篇博客主要讲协同过滤。协同过滤Collaborative Filtering协同过滤:使用

2016-07-03 18:17:48 49187 6

原创 linux及windows文件共享

http://blog.csdn.net/pipisorry/article/details/51812022本文主要说明 linux和windows文件共享, windows和ubuntu互相访问 , Linux和安卓设备文件互传和共享。(ubuntu16.04, 14.04和win7测试通过)linux和windows文件共享window对linux文件内容进行操作,利用linux samba

2016-07-02 20:44:57 18485

原创 分类模型评估之ROC-AUC曲线和PRC曲线

http://blog.csdn.net/pipisorry/article/details/51788927ROC曲线和AUCROC(Receiver Operating Characteristic,接受者工作特征曲线)曲线和AUC常被用来评价一个二值分类器(binary classifier)的优劣。博文介绍ROC和AUC的特点,讨论如何作出ROC曲线图以及计算AUC。AUC是现...

2016-06-30 11:27:09 95059 24

原创 Ubuntu和Windows设备共享

http://blog.csdn.net/pipisorry/article/details/51725942蓝牙设备如键盘、鼠标都可以。装的双系统win7和Ubuntu,如果只使用一个系统,蓝牙鼠标配对一次后可以正常使用,但如果下次进的另一个系统必须要重新配对才能使用。所以这篇文章就是解决这个问题的,同一台电脑在双系统间切换时不用重新设置蓝牙鼠标。皮皮blog安装蓝牙模块{电脑自带蓝牙的略过}l

2016-06-21 22:24:34 9888 1

原创 Makefile自动生成:cmake

编辑makefile文件CMakeLists.txt,使用cmake命令自动生成makefile文件。一个示例CMakeLists.txt:cmake_minimum_required(VERSION 2.8)project(bgs)set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -std=gnu++0x")set(CMAKE_C_FLAGS "${CMAKE_C_

2016-06-20 12:44:24 10880

Parameter estimation for text analysis

Parameter estimation for text analysis Gregor Heinrich Parameter estimation for text analysis Gregor Heinrich Parameter estimation for text analysis Gregor Heinrich Parameter estimation for text analysis Gregor Heinrich Parameter estimation for text analysis Gregor Heinrich Parameter estimation for text analysis Gregor Heinrich

2016-05-23

pdfstudio安装文件及破解

pdfstudio v9版本及其破解jar pdfstudio v9版本及其破解jar pdfstudio v9版本及其破解jar pdfstudio v9版本及其破解jar pdfstudio v9版本及其破解jar

2016-03-24

spark机器学习示例代码

spark机器学习示例代码 machine learning with spark

2016-03-06

偏置方差分解推导

偏置方差分解 Bias-variance decompose

2016-02-05

Bias-variance decomposition推导

Bias-variance decomposition 偏置方差分解推导

2016-02-05

milk安装包

milk 安装包 win7 64位 python2

2016-01-02

python2 scipy安装包

scipy 安装包 win7 64位 python2.exe

2016-01-02

pywin32 py2安装包

scikit-learn 安装包 win7 64位 python2

2016-01-02

scikit learn py2安装包

scikit-learn 安装包 win7 64位 python2

2016-01-02

matplotlib安装包

matplotlib安装文件 win7 64位 python2 包含matplotlib.exe安装文件及其依赖包(pyparsing,dateutil等等) 先安装依赖包,再安装matplotlib.exe文件

2016-01-02

python pip安装包

python pip 安装包 win7 64位 python2

2016-01-02

numpy安装包

numpy 安装包 win7 64位 python2

2016-01-02

scipy安装包

scipy 安装包 win7 64位 python3

2016-01-02

scikit learn安装包

scikit-learn 安装包 win7 64位 python3

2016-01-01

PyQt5安装包

PyQt5 安装包 win7 64位 python3

2016-01-01

pandas安装文件

pandas-0.16.0-cp34-none-win_amd64.whl安装包 win7 64位 python3拓展安装包 提示: 安装whl文件方法 1>打开python,在python命令行中输入(如果提示install错误,见2>) pip install ****.whl 2>直接在cmd中输入上面的安装命令

2016-01-01

matplotlib安装文件

matplotlib安装文件 win7 64位 python3 包含matplotlib.exe安装文件及其依赖包(pyparsing,dateutil等等) 先安装依赖包,再安装matplotlib.exe文件

2016-01-01

SnapShot4.4.exe

QQ2015 截图工具 可以截取弹窗 可以保存 完全如同打开QQ后的截图一样

2015-09-03

get-pip.py

python pip安装程序

2015-08-12

GB2UTF8.exe

GB2UTF8.exe utf8 gbk big5三向转换,方便您将文本文件转换到需要的格式。 utf8 gbk big5三向转换,方便您将文本文件转换到需要的格式。 utf8 gbk big5三向转换,方便您将文本文件转换到需要的格式。

2015-08-07

主题挖掘测试数据

主题挖掘测试数据

2015-06-03

Introduction to Computation and Programming Using Python

Introduction to Computation and Programming Using Python

2015-05-03

A First Course in Probability 第8版 Sheldon Ross

A First Course in Probability 第8版 英文版 Sheldon Ross 概率论基础教程 第8版 Sheldon Ross A First Course in Probability 第8版 英文版 Sheldon Ross 概率论基础教程 第8版 Sheldon Ross A First Course in Probability 第8版 英文版 Sheldon Ross 概率论基础教程 第8版 Sheldon Ross A First Course in Probability 第8版 英文版 Sheldon Ross 概率论基础教程 第8版 Sheldon Ross A First Course in Probability 第8版 英文版 Sheldon Ross 概率论基础教程 第8版 Sheldon Ross A First Course in Probability 第8版 英文版 Sheldon Ross 概率论基础教程 第8版 Sheldon Ross

2014-10-31

GAME THEORY-Thomas

GAME THEORY-Thomas

2014-09-13

组合博弈入门.ppt

组合博弈入门.ppt

2014-09-13

noi2002测试数据

noi2002测试数据

2014-09-13

NOI2012测试数据

NOI2012测试数据

2014-09-13

NOI2011测试数据

NOI2011测试数据

2014-09-13

noi2010测试数据

noi2010测试数据

2014-09-13

noi2009测试数据

noi2009测试数据

2014-09-13

noi2008测试数据

noi2008测试数据

2014-09-13

技术之瞳-阿里巴巴技术笔试心得 文字版pdf

技术之瞳-阿里巴巴技术笔试心得 完整文字版pdf

2017-04-21

wps symbol fonts

wps symbol font WPS for Linux 字体缺失的解决办法 启动WPS for Linux后,出现提示"系统缺失字体" 。 出现提示的原因是因为WPS for Linux没有自带windows的字体,只要在Linux系统中加载字体即可。 具体操作步骤如下: 1. 下载缺失的字体文件,然后复制到Linux系统中的/usr/share/fonts文件夹中。 下载完成后,解压并进入目录中,继续执行: sudo cp * /usr/share/fonts 2. 执行以下命令,生成字体的索引信息: sudo mkfontscale sudo mkfontdir 3. 运行fc-cache命令更新字体缓存。 sudo fc-cache 4. 重启wps即可,字体缺失的提示不再出现。

2017-02-27

Structured PCA

Structured Principal Component Analysis, Structured PCA

2016-08-02

PCAS示例代码

PCAS 示例代码 PlaneParts showpcs

2016-08-01

KcoreVertex

KcoreVertex c++代码 graphlite+hadoop实现

2016-06-10

avg-time hadoop程序

avg-time hadoop程序

2016-06-10

Anand.Rajaraman-Mining of Massive Datasets

Anand.Rajaraman-Mining of Massive Datasets-mmds 完整带书签文字版 Anand.Rajaraman-Mining of Massive Datasets-mmds 完整带书签文字版 Anand.Rajaraman-Mining of Massive Datasets-mmds 完整带书签文字版 Anand.Rajaraman-Mining of Massive Datasets-mmds 完整带书签文字版 Anand.Rajaraman-Mining of Massive Datasets-mmds 完整带书签文字版

2016-06-01

GIBBS SAMPLING FOR THE UNINITIATED

Philip Resnik-GIBBS SAMPLING FOR THE UNINITIATED

2016-05-30

概率图模型 原理与技术 科勒 清华大学 完整版

概率图模型 原理与技术 科勒 清华大学 完整版

2016-05-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除