数据挖掘
文章平均质量分 80
Postgresql中国用户会
Postgresql中国用户会致力于PostgreSQL在中国的推广
主要负责PostgreSQL各大会议在中国的信息发布,技术牛文的推广。
展开
-
PostgreSQL aggregate function 2 : Aggregate Functions for Statistics
前面一篇对PostgreSQL支持的一般聚合函数做了一些实例讲解, http://blog.163.com/digoal@126/blog/static/16387704020152223539859/本文将讲解一下统计类的聚合函数.在此前我分别以相关性函数corr和计算总体/样本 方差, 标准方差的函数variance, var_pop, var_samp, stddev转载 2015-10-14 21:09:25 · 591 阅读 · 0 评论 -
用PostgreSQL了解一些统计学术语以及计算方法和表示方法 - 1
1. 数学期望值, 平均值, meanhttp://zh.wikipedia.org/wiki/%E6%9C%9F%E6%9C%9B%E5%80%BC表示: E[X], 即X变量的平均值.也用miu表示 : μ=E[X]PostgreSQL中举例 : postgres=# select avg(c1) from (values(null),(1)转载 2015-10-14 21:01:01 · 975 阅读 · 0 评论 -
PostgreSQL aggregate function 1 : General-Purpose Aggregate Functions
PostgreSQL支持较多的聚合函数, 以PostgreSQL 9.4为例, 支持例如一般性的聚合, 统计学科的聚合, 排序集聚合, 假象集聚合等.本文将对一般性聚合函数举例说明其功能和用法.以下图表参考 : http://www.postgresql.org/docs/9.4/static/functions-aggregate.htmlFunc转载 2015-10-14 21:08:40 · 606 阅读 · 0 评论 -
在PostgreSQL中用线性回归分析linear regression做预测
首选来个线性回归分析linear regression, 最小二乘法least-squares-fit的小故事(取自百度) : 1801年,意大利天文学家朱赛普·皮亚齐发现了第一颗小行星谷神星。经过40天的跟踪观测后,由于谷神星运行至太阳背后,使得皮亚齐失去了谷神星的位置。随后全世界的科学家利用皮亚齐的观测数据开始寻找谷神星,但是根据大多数人计算的结果来寻找谷神星都没有结果。时年24岁的高转载 2015-10-14 21:02:36 · 2289 阅读 · 0 评论 -
K-Means 数据聚集算法
K-Means是什么?引用一篇网友的文章:http://coolshell.cn/articles/7779.htmlPostgreSQL有一个k-means插件,可以用来实现kmean数据聚集统计,用在窗口函数中。用法举例: SELECT kmeans(ARRAY[x, y, z], 10) OVER (), * FROM samples;转载 2015-10-14 20:56:41 · 669 阅读 · 0 评论 -
PostgreSQL数据库监控中的统计学 - 对象空间的数据分布图
有时,我们为了直观的显示对象的空间占用及分布情况,我们可能会以图表的形式展示。通常情况下,我们可以根据需求,以柱状图或者聚集图的形式来展示,从各个维度来了解数据空间占用的分布情况,例如:1. bucket分布,就是按大小排序,选定要划分为几个bucket,每个bucket放同样数量的对象,输出bucket的边界,形式和pg_stats.histogram_bounds的输出类似。方法举转载 2015-10-14 20:54:30 · 547 阅读 · 0 评论 -
PostgreSQL aggregate function 4 : Hypothetical-Set Aggregate Functions
本文讲一下聚合函数的最后一个分类, Hypothetical-Set Aggregate Functions.这类聚合函数还有对应的窗口函数, 首先来看一下对应窗口函数的用法.rank()bigintrank of the current row with gaps; same as row_number of its first peer转载 2015-10-14 21:11:02 · 451 阅读 · 0 评论 -
在PostgreSQL中用线性回归分析linear regression做预测 - 例子1
本文是一个简单的一元线性回归的例子, 需要了解相关理论知识可参考 : http://blog.163.com/digoal@126/blog/static/163877040201523112651593/数据来自股票的收盘价.如果要做多元分析, 请自行增加维度(例如大盘指数,成交量,最低,最高价,价格区间等等都可以那里做回归计算), 计算期望值.转载 2015-10-14 21:04:16 · 1077 阅读 · 0 评论 -
PostgreSQL attr correlation for values(logical order) & ctid (physcial order)
PostgreSQL统计信息中, 有一个相关性的统计, 在pg_stats.correlation中可以查看到, 统计值范围从-1到1, 趋向于-1表示逆向相关, 趋向于1表示正向相关, 趋向于0表示不相关.postgres=# \d pg_stats View "pg_catalog.pg_stats" Column | Ty转载 2015-10-14 20:57:55 · 363 阅读 · 0 评论 -
PostgreSQL aggregate function 3 : Aggregate Functions for Ordered-Set
之前写了两篇关于一般聚合和统计类聚合的函数的用法, http://blog.163.com/digoal@126/blog/static/16387704020152223539859/http://blog.163.com/digoal@126/blog/static/1638770402015224124337/本文主要讲一下分组排序聚合的例子.Tabl转载 2015-10-14 21:10:15 · 621 阅读 · 0 评论 -
在PostgreSQL中用线性回归分析linear regression做预测 - 例子2, 预测未来数日某股收盘价
请先参考 : http://blog.163.com/digoal@126/blog/static/1638770402015224124337/http://blog.163.com/digoal@126/blog/static/16387704020152245224236/http://blog.163.com/digoal@126/blog/static/16387转载 2015-10-14 21:05:27 · 935 阅读 · 0 评论