- 博客(683)
- 资源 (104)
- 收藏
- 关注
原创 Linux:文件格式化与相关处理及sed工具
http://blog.csdn.net/pipisorry/article/details/52564957geditor, sed, ed, awk, Emacs文本处理工具[Linux Shell 文本处理工具集锦]geditor最常用的类似windows下的记事本ubuntu16.04 gedit乱码问题解决gsettings set org.gnome.ged...
2016-09-17 20:40:31 3398 1
原创 PGM:部分有向模型之条件随机场与链图模型
http://blog.csdn.net/pipisorry/article/details/52529287贝叶斯网与马尔可夫网[PGM:无向图模型:马尔可夫网 ]中例3.8和例4.8显示,贝叶斯网和马尔可夫网这两种表示独立性的语言没有可比性:每种表示都能表示另一种不能表示的独立性约束。这里更深入讨论两种表示间的联系。从贝叶斯网到到马尔可夫网d-分离的可靠性
2016-09-14 11:14:59 3606
原创 图论
http://blog.csdn.net/pipisorry/article/details/52518118最大团给定无向图G=(V,E),其中V是非空集合,称为顶点集;E是V中元素构成的无序二元组的集合,称为边集,无向图中的边均是顶点的无序对,无序对常用圆括号“( )”表示。完全子图complete subgraph如果U∈V,且对任意两个顶点u,v∈U有(u,v)∈E,则称U是G的完全子图。
2016-09-12 22:28:03 2637
原创 PGM:无向图模型:马尔可夫网(随机场)MRF
http://blog.csdn.net/pipisorry/article/details/52489321马尔可夫网皮皮blog无向图模型误解示例P-map不能构建贝叶斯网的一个示例x1表示这个学生对概念存在误解,x0表示没有。Note: 其中的bd其实只要给定c就是相互依赖了。[PGM:贝叶斯网络 ]误解示例的无向图模型解决
2016-09-12 22:27:54 13510 3
原创 PGM:有向图模型:贝叶斯网络
http://blog.csdn.net/pipisorry/article/details/52489270为什么用贝叶斯网络联合分布的显式表示Note: n个变量的联合分布,每个x对应两个值,共n个x,且所有概率总和为1,则联合分布需要2^n-1个参数。贝叶斯网表示独立性质的应用会降低参数数目,表达更紧凑。[PGM:贝叶斯网表示之朴素贝叶斯模型naive Bayes
2016-09-09 17:26:10 27884
原创 文件自动备份和同步bypy和syncthing
http://blog.csdn.net/pipisorry/article/details/52464402Linux定时备份数据到百度云盘 sudo pip3 install requestssudo pip3 install bypy备份脚本示例#!/bin/sh# File: ~/bysync.sh# Author
2016-09-08 23:03:15 11994
原创 PGM:贝叶斯网表示之朴素贝叶斯模型naive Bayes
http://blog.csdn.net/pipisorry/article/details/52469064独立性质的利用条件参数化和条件独立性假设被结合在一起,目的是对高维概率分布产生非常紧凑的表示。随机变量的独立性[PGM:概率论基础知识 :独立性性质的利用]条件参数化方法Note: P(I), P(S | i0), P(S | i1)都是二项式分布,都
2016-09-08 11:06:01 4889 2
原创 PGM:概率论基础知识
http://blog.csdn.net/pipisorry/article/details/52459847概率图模型PGM:概率论基础知识独立性与条件独立性独立性条件独立性也就是表示给定 c 的条件下 a 与 b 条件独立,等价于公式p(a | b, c) = p(a | c)随机变量的独立性 等价于 条件独立性的性质这里是前面的独立性可以导出后面的独立性,而不是等价于后面的独立性。条件独立的
2016-09-07 15:20:48 2103
原创 操作系统服务:其它模块
http://blog.csdn.net/pipisorry/article/details/52454579IO模块16.2. io — Core tools for working with streams16.2.1. Overview16.2.1.1. Text I/O16.2.1.2. Binary I/O16.2.1.3. Raw I/O16.2.2. High-level Modul
2016-09-06 23:00:50 1121
原创 操作系统服务:OS模块
http://blog.csdn.net/pipisorry/article/details/52454486一般的操作系统服务之OS模块Generic Operating System Servicesos模块模块包含普遍的操作系统功能。利用这个模块可以写出与平台无关的程序,比如就是使用os.sep可以取代操作系统特定的路径分割符。os模块包含 Tasks Too...
2016-09-06 22:48:23 2271
原创 Spark运行架构
http://blog.csdn.net/pipisorry/article/details/523662881、 Spark运行架构1.1 术语定义lApplication:Spark Application的概念和Hadoop MapReduce中的类似,指的是用户编写的Spark应用程序,包含了一个Driver 功能的代码和分布在集群中多个节点上运行的Executor代码;lDriver:S
2016-08-30 09:17:19 2989
原创 Pycharm中进行Python远程开发
http://blog.csdn.net/pipisorry/article/details/52269952PyCharm提供两种远程调试(Remote Debugging)的方式: 配置远程的解释器(remote interpreter) 配置Python调试服务器(Python Debug Server)[配置Python调试服务器]本文主要说明远程的解释器(remote int
2016-08-22 10:26:45 59215 4
原创 Scikit-learn:模型选择之调参grid search
http://blog.csdn.net/pipisorry/article/details/52268947Scikit-learn:并行调参Grid SearchGrid Search: Searching for estimator parametersscikit-learn中提供了pipeline(for estimator connection) & grid_search(searc
2016-08-22 09:08:55 4582
原创 ssh用法及命令
http://blog.csdn.net/pipisorry/article/details/52269785什么是SSH?简单说,SSH是一种网络协议,用于计算机之间的加密登录。如果一个用户从本地计算机,使用SSH协议登录另一台远程计算机,我们就可以认为,这种登录是安全的,即使被中途截获,密码也不会泄露。最早的时候,互联网通信都是明文通信,一旦被截获,内容就暴露无疑。1995年,芬兰学者...
2016-08-21 22:15:43 502150 18
原创 Scikit-learn:scikit-learn快速教程及实例
http://blog.csdn.net/pipisorry/article/details/52251305scikit-learn 教程导航简介:使用scikit-learn进行机器学习 机器学习:问题设定加载样例数据集学习和预测模型持久化惯例 统计学习教程 统计学习:scikit-learn中的配置和estimator对象有监督学习:预测高维观测对象模型选择:选择estimator和参数无
2016-08-19 15:33:25 20247
原创 Scikit-learn:分类模型评估Model evaluation
http://blog.csdn.net/pipisorry/article/details/52250760模型评估Model evaluation: quantifying the quality of predictions3 different approaches to evaluate the quality of predictions of a model:Estimator sc...
2016-08-19 15:19:34 18957 1
原创 Scikit-learn:模型选择Model selection之pipline和交叉验证
http://blog.csdn.net/pipisorry/article/details/52250983选择合适的estimator通常机器学习最难的一部分是选择合适的estimator,不同的estimator适用于不同的数据集和问题。sklearn官方文档提供了一个图[flowchart],可以快速地根据你的数据和问题选择合适的estimator,单击相应的区域还可以获得...
2016-08-19 15:15:10 11183 2
原创 Scikit-learn:数据预处理Preprocessing data
http://blog.csdn.net/pipisorry/article/details/52247679 本blog内容有特征预处理(标准化、归一化、正则化、特征二值化、缺失值处理)和标签label预处理(label二值化、multi-label多值化)。特征的预处理基础知识参考[数据标准化/归一化normalization ][均值、方差与协方差矩阵 ]...
2016-08-19 10:25:26 28258 8
原创 Scikit-learn:主要模块和基本使用方法
http://blog.csdn.net/pipisorry/article/details/52128222scikit-learn: Machine Learning in Python.scikit-learn库实现了很多机器学习算法。scikit-learn是一个基于NumPy, SciPy, Matplotlib的开源机器学习工具包,主要涵盖分类,回归和聚类算法,例如SVM, 逻...
2016-08-19 10:22:28 9910
原创 数据标准化/归一化normalization
http://blog.csdn.net/pipisorry/article/details/52247379这里主要讲连续型特征归一化的常用方法。连续型特征还有一种处理方式是,先分桶/分箱(如等频/等距的分)[待写]进行离散化后再使用离散数据的处理方法。离散数据处理参考[数据预处理:独热编码(One-Hot Encoding)]。基础知识参考:[均值、方差与协方差矩阵][...
2016-08-19 09:42:40 439830 69
原创 最优化方法:L1和L2正则化regularization
http://blog.csdn.net/pipisorry/article/details/52108040机器学习和深度学习常用的规则化方法之一:L范数正则化(规格化)。一般来说,监督学习可以看做最小化下面的目标函数):θ∗=argminθ1N∑i=1NL(yi,f(xi;θ))+λ
2016-08-18 17:06:31 49453 6
原创 数值分析:矩阵求逆-奇异性、条件数
http://blog.csdn.net/pipisorry/article/details/52241141本blog主要内容有:矩阵的奇异性、条件数与病态矩阵、矩阵求逆。奇异矩阵和非奇异矩阵singular matrix&nonsingular matrix概念和定义若n阶矩阵A的行列式不为零,即 |A|≠0,则称A为非奇异矩阵或满秩矩阵,否则称A为奇异矩阵或降秩矩阵。奇异矩阵是线性代数的概念
2016-08-18 15:59:06 31875
原创 最优化方法:拉格朗日乘数法
解决约束优化问题——拉格朗日乘数法拉格朗日乘数法(Lagrange Multiplier Method)应用广泛,可以学习麻省理工学院的在线数学课程。1. 拉格朗日乘数法的基本思想 作为一种优化算法,拉格朗日乘子法主要用于解决约束优化问题,它的基本思想就是通过引入拉格朗日乘子来将含有n个变量和k个约束条件的约束优化问题转化为含有(n+k)个变量的无约束优化问题。拉格朗日乘子背后的数学意义是其为约
2016-08-18 14:34:38 63825 2
原创 最优化方法:深度学习最优化方法
http://blog.csdn.net/pipisorry/article/details/52135832深度学习最优化算法深度学习框架中常见的最优化方法,如tensorflow中的最优化方法及相关参数如下:tf.train.Optimizer tf.train.GradientDescentOptimizer tf.train.AdadeltaOptimizer tf.tr...
2016-08-18 14:33:32 11080 1
原创 统计处理包Statsmodels: statistics in python
StatsmodelsStatsmodels is a Python package that provides a complement to scipy for statistical computations including descriptive statistics and estimation of statistical models.statsmodels原名叫scikits.
2016-08-17 09:05:18 19046
原创 pandas小记:pandas时间序列分析和处理Timeseries
http://blog.csdn.net/pipisorry/article/details/52209377pandas 最基本的时间序列类型就是以时间戳(TimeStamp)为 index 元素的 Series 类型。其它时间序列处理相关的包[P4J 0.6: Periodic light curve analysis tools based on Information Theory][p4
2016-08-15 15:34:17 105341 1
原创 pandas小记:pandas数据输入输出
http://blog.csdn.net/pipisorry/article/details/52208727输出格式控制pandas dataframe数据全部输出,数据太多也不用省略号表示。pd.set_option('display.max_columns',None)或者with option_context('display.max_rows', 10, 'dis...
2016-08-15 10:12:28 41184
原创 python地理数据处理库geopy
python地理位置处理python地理编码地址以及用来处理经纬度的库GeoDjango – 世界级地理图形 web 框架。GeoIP – MaxMind GeoIP Legacy 数据库的Python API。geojson – GeoJSON 的 Python 绑定及工具。geopy – Python 地址编码工具箱。pygeoip – 纯 Python GeoIP API。django-co
2016-08-14 17:35:47 26666 2
原创 常用三角公式
基本公式两角和与差公式及规律二倍角公式及规律 半角公式三倍角公式积化和差与和差化积公式万能公式皮皮blog诱导公式同角三角函数基本关系皮皮blog应注意的问题1、两角差的余弦公式是本章中其余公式的基础,应记准该公式的形式. 2、倍角公式有升、降幂的功能,如果升幂,则角减半,如果降幂,则角加倍,根据条件灵活选用. 3、公式的“三用”(顺用、逆用、变用)是熟练进行三角变形的前提.3、整体原则-----
2016-08-13 17:22:46 4614 1
原创 微积分:常用公式、微分方程、级数
http://blog.csdn.net/pipisorry/article/details/52200140微积分一.基本初等函数求导公式函数的和、差、积、商的求导法则反函数求导法则复合函数求导法则皮皮blog二、基本积分表 皮皮blog常用凑微分公式[常用的求导和定积分公式(完美)]分部积分不定积分的分部积分设 及 是两个关于 的函数,各自具有连续导数 及 ,则按照乘积函数求微分法则,则
2016-08-13 17:03:32 299926 18
原创 最近邻查找算法kd-tree
http://blog.csdn.net/pipisorry/article/details/52186307海量数据最近邻查找的kd-tree简介 利用Octree,為封閉的3D空間建立一個資料結構來管理空間中的每個元素。如此我們可以在 O(log N) 的時間內對這3D空間進行搜尋。 3D空間可以用Octree,2D空間可以用Quadtree(四元樹,概...
2016-08-12 10:12:01 60414 6
原创 非负矩阵分解NMF
http://blog.csdn.net/pipisorry/article/details/52098864非负矩阵分解(NMF,Non-negative matrix factorization)NMF的发展及原理 著名的科学杂志《Nature》于1999年刊登了两位科学家D.D.Lee和H.S.Seung对数学中非负矩阵研究的突出成果。该文提出了一种新的矩阵分解思想——非负矩阵分解(Non
2016-08-03 12:37:26 83993 25
原创 Linux: Shell scripts
发个文艺点的博客。。。哈哈又是一个草长莺飞的季节,虽然有些寒冷又有些雨水,但是等待微风徐徐阳光暖人的初春总是一件让人快乐的事情!春天是一年中最好的赏花季节,桃花,杏花,樱花,梨花,李花,海棠花,这么多美丽的花,你还傻傻分不清吗?我们一起来认识一下吧! 手绘版 真图版 桃花 分辨要点: 1、单朵开放,花瓣略尖。 2、花期仲春,边开花边长叶。 3、颜色红润。 梅花 分辨要点: 1、
2016-07-06 10:09:42 4301
原创 numpy教程:排序、搜索和计数
http://blog.csdn.net/pipisorry/article/details/51822775numpy排序、搜索和计数函数和方法。(重新整合过的)排序Sortingsort(a[,axis,kind,order])Return a sorted copy of an array.lexsort(keys[,axis])Perform an indirect sort us...
2016-07-04 18:24:02 101639 3
原创 推荐系统:协同过滤collaborative filtering
http://blog.csdn.net/pipisorry/article/details/51788955(个性化)推荐系统构建三大方法:基于内容的推荐content-based,协同过滤collaborative filtering,隐语义模型(LFM, latent factor model)推荐。这篇博客主要讲协同过滤。协同过滤Collaborative Filtering协同过滤:使用
2016-07-03 18:17:48 49187 6
原创 linux及windows文件共享
http://blog.csdn.net/pipisorry/article/details/51812022本文主要说明 linux和windows文件共享, windows和ubuntu互相访问 , Linux和安卓设备文件互传和共享。(ubuntu16.04, 14.04和win7测试通过)linux和windows文件共享window对linux文件内容进行操作,利用linux samba
2016-07-02 20:44:57 18485
原创 分类模型评估之ROC-AUC曲线和PRC曲线
http://blog.csdn.net/pipisorry/article/details/51788927ROC曲线和AUCROC(Receiver Operating Characteristic,接受者工作特征曲线)曲线和AUC常被用来评价一个二值分类器(binary classifier)的优劣。博文介绍ROC和AUC的特点,讨论如何作出ROC曲线图以及计算AUC。AUC是现...
2016-06-30 11:27:09 95059 24
原创 Ubuntu和Windows设备共享
http://blog.csdn.net/pipisorry/article/details/51725942蓝牙设备如键盘、鼠标都可以。装的双系统win7和Ubuntu,如果只使用一个系统,蓝牙鼠标配对一次后可以正常使用,但如果下次进的另一个系统必须要重新配对才能使用。所以这篇文章就是解决这个问题的,同一台电脑在双系统间切换时不用重新设置蓝牙鼠标。皮皮blog安装蓝牙模块{电脑自带蓝牙的略过}l
2016-06-21 22:24:34 9888 1
原创 Makefile自动生成:cmake
编辑makefile文件CMakeLists.txt,使用cmake命令自动生成makefile文件。一个示例CMakeLists.txt:cmake_minimum_required(VERSION 2.8)project(bgs)set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -std=gnu++0x")set(CMAKE_C_FLAGS "${CMAKE_C_
2016-06-20 12:44:24 10880
Parameter estimation for text analysis
2016-05-23
pdfstudio安装文件及破解
2016-03-24
matplotlib安装包
2016-01-02
pandas安装文件
2016-01-01
matplotlib安装文件
2016-01-01
GB2UTF8.exe
2015-08-07
Introduction to Computation and Programming Using Python
2015-05-03
A First Course in Probability 第8版 Sheldon Ross
2014-10-31
wps symbol fonts
2017-02-27
Anand.Rajaraman-Mining of Massive Datasets
2016-06-01
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人