自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 在pyqt5上各种不同的画图方式

使用Python的qt5各种不同画图方式

2022-12-19 16:43:03 658 1

原创 plotly作图与点击交互

函数调用后会生成一个可以交互的图像,通过click_times的值来控制点击坐标的次数,达到点击次数后会退出函数

2022-12-06 17:24:59 1041

原创 python中偏度和峰度的计算公式

通过python计算的偏度与峰度的计算公式

2022-07-06 11:52:57 1290 1

原创 c++ 复合结构的基本用法

最近刚好有个项目需要加强下处理性能,因此学习了一下c++的使用,基础的肯定是各种stl的使用,复合结构自己摸索了几天,写出来给大家一起分享下,有不足的地方欢迎指正,废话不多说,直接上代码:#include <iostream>#include <vector>#include <map>using namespace std;//定义结构体的字段struct order{ string oid,cancel_state,direct; fl...

2020-12-12 15:09:43 359

原创 回归分析

用R语言实现简单回归分析1、一元线性回归分析:2、多元线性回归分析回归分析是确定两个或两个以上变量之间相互关系的一种统计方法,回归分析按照涉及的变量的多少,分为一元回归和多元回归分析;按照自变量的多少,可分为简单回归分析和多重回归分析 ;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析;其中只包括一个自变量和一个因变量的回归分析,可以近似的用一条直线表述两个变量之间关系的方法...

2019-11-21 14:40:39 2740

原创 统计学基础指标

统计学一些基础知识 统计学分为两个统计学科,分别为描述统计学和推断统计学; 描述统计学:使用特定的数字或图表来体现数据的集中程度和离散程度。例:每次考试算的平均分,最高分,各个分段的人数分布等,也是属于描述统计学的范围。 推断统计学:根据样本数据推断总体数据特征。例:产品质量检查,一般采用抽检,根据所抽样本的质量合格率作为总体的质量合格率的一个估计。 常用统计学的数据指标有: 均值——算...

2019-11-18 14:36:56 8867

原创 hive的三种排序方式

经常会出现需要排序的问题,比如说学生成绩相同的时候以什么规则进行排序。排序使用到以下三个函数:Row_number/rank/dense_rank:原表如下test_table:name scorezhangsan 98lisi 95wangwu 95zhaoliu 95zhuqi 90效果比较:1...

2019-10-29 17:47:16 1557

原创 开窗函数实现累加

开窗函数使用SQL里开窗函数灵活运用以后可以给数据的计算提供很大的便利性,话不多说,直接进入正题,表结构如下:对照这个表我想知道每个学生的总成绩,各科目的最高分,每个班级的平均成绩,这时用开窗函数就可以一次性求出来。SELECT DISTINCT stuid,stuname,class,course,sum(score) over(partition by stuid,stuname) ...

2019-10-25 12:36:24 4899

原创 hive中灵活运用正则表达式处理字段

灵活运用正则表达式hive中经常会需要处理字符串,本篇文章就来聊聊如何灵活运用正则表达式来出来数据;正则表达式中的符号介绍^ 匹配输入字符串的开始位置。$ 匹配输入字符串的结束位置。[…] 字符集合。匹配所包含的任意一个字符。例如, ‘[abc]’ 可以匹配 “plain” 中的 ‘a’。[^…] 负值字符集合。匹配未包含的任意字符。例如, ‘[^abc]’ 可以匹配 “plain” ...

2019-10-23 16:11:16 1052

原创 hive []里的字段计数问题

hive []里的字段计数问题@TOC欢迎使用Markdown编辑器例如有下面一个字段,需要计算[]中的数字个数string1[][9005][9005,9006][9005,9001,9002,9008,9007,9004,9007,9003][9004,9002]看到这个问题,第一想法是计算[]中,的个数,这时可以用instr函数。但是这个问题主要需要解决的是为空和1个数字...

2019-10-22 11:41:33 1497

原创 初识决策树算法

决策树ID3决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。由于这种决策分支画成图形很像一棵树的枝干,故称决策树。通俗的来讲,就是在已经知道某个事件发生的概率的情况下,通过构建一个模型来推测已知条件下的结果。模型怎么建立呢,网上看了很多博客,都是...

2019-06-17 17:53:35 186

原创 hivesql 行转列(collect_set)与列转行(explode和posexplode)

hivesql 行转列与列转行列转行函数——collect_set和collect_listhive里通常通过collect_set和collect_list来进行列转行,其中collect_list为不去重转换,collect_set为去重转换。下面我们将通过一个实例来进行说明:创建一个学生成绩表CREATE table student_score(stu_id string com...

2019-06-14 11:06:04 19274 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除