蒲公英丶种子
码龄12年
关注
提问 私信
  • 博客:61,858
    61,858
    总访问量
  • 7
    原创
  • 550,053
    排名
  • 3
    粉丝
  • 0
    铁粉

个人简介:勤于思考,乐于总结

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:陕西省
  • 加入CSDN时间: 2012-10-31
博客简介:

蒲公英的种子

查看详细资料
个人成就
  • 获得7次点赞
  • 内容获得0次评论
  • 获得47次收藏
创作历程
  • 1篇
    2021年
  • 1篇
    2019年
  • 1篇
    2016年
  • 1篇
    2015年
  • 17篇
    2014年
成就勋章
TA的专栏
  • Hive
    4篇
  • 正则表达式
    1篇
  • Linux
    3篇
  • Java
    2篇
  • MySQL
    8篇
  • 数据挖掘
    2篇
  • 数据库
    4篇
  • 统计学
    2篇
  • 数据化运营
    1篇
  • EDM
    1篇
  • python数据分析
    1篇
  • 漫谈
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

Hive grouping sets 多维度交叉清洗数据

工作中经常会遇到需要多维度交叉清洗数据的情况,比如计算每天的活跃用户数,需要知道每天整体dau,同时也需要知道不同平台如Android、iOS各自的dua。一般情况下这种情况可能需要写两个query,第一个query仅按日期 group by,第二个query按日期+平台 group by。针对这种情况Hive提供了grouping sets可以简单方式通过一个query实现相同的效果。语法结构如下:select day_id,platform,count(distinct user_id
原创
发布博客 2021.04.23 ·
338 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

Hive 多维度聚合分析查询

熟练使用多维度聚合函数,可以帮助开发者减少在处理数据时需要根据不同维度多次union query的代码编写工作Hive常见的多维度聚合函数有:With Cube:任意维度聚合 Grouping Sets:指定维度聚合 With Rollup:GROUP BY最左侧的维度为主层级聚合函数说明1、with cube1)语法:GROUP BY a,b WITH CUBE。...
原创
发布博客 2019.05.16 ·
2861 阅读 ·
0 点赞 ·
0 评论 ·
11 收藏

用 awk 统计文本文件中的某一列之和 (附 awk 命令简介)

awk -F'\t' -v sum=0 '{sum += $1} END{print sum}' file_name统计输出结果的最后一列之和:result | awk -F'\t' -v sum=0 '{sum += $NF} END{print sum}'附: awk 命令简介Unix / Linux 系统中,多用纯文本文件表示一些带格式的内容,比如就像数据库里
转载
发布博客 2016.03.15 ·
10065 阅读 ·
0 点赞 ·
0 评论 ·
6 收藏

ipython 报错:pkg_resources.DistributionNotFound: importlib

问题:mac 启动ipython报错,pkg_resources.DistributionNotFound: gnureadline解决方法:重新安装ipython终端输入:1.export CFLAGS=-Qunused-arguments2.export CPPFLAGS=-Qunused-arguments3.sudo -E pip install i
原创
发布博客 2015.08.21 ·
2071 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

hive内置操作符与函数

hive内置操作符与函数第一部分:关系运算Hive支持的关系运算符•常见的关系运算符•等值比较: =•不等值比较: •小于比较: •小于等于比较: •大于比较: >•大于等于比较: >=•空值判断: IS NULL•非空判断: IS NOT NULL•LIKE比较: LIKE•JAVA的LIKE操作: RLIKE
转载
发布博客 2014.12.18 ·
491 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

二分查找(java实现)

二分public class BinarySearch{ public static void main(String[] args) { int[] arr = new int[] { 1, 2, 4, 6, 7, 8, 9, 10 }; BinarySearch bs = new BinarySearch(); int pos = bs.recurs
原创
发布博客 2014.11.20 ·
514 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

网站运营活跃用户、流失用户、流失率、新用户流失率定义以及诠释

网站运营活跃用户、流失用户、流失率、新用户流失率定义以及诠释2012-12-22 745 人次浏览 评论 0 条核心提示:本文简单介绍了活跃用户数、流失用户数、流失率、新用户流失率这几个概念。当然,比较大型的网站还会有许多细分数据:普通用户、活跃用户、优质用户、普通用户流失率、活跃用户流失率、优质用户流失率等等。还可分为不同来源、不同等级、不同场景等等。 任
转载
发布博客 2014.11.11 ·
8956 阅读 ·
2 点赞 ·
0 评论 ·
12 收藏

EDM营销

eDM相关内容整理:1.eDM的KPI发送数,到达率,(独立)打开率,链接(独立)点击率,广告的采纳率。2.eDM中的数据筛选过滤无效用户,选取优质用户3.eDM上的RFM模型应用(测算客户价值)消费时间间隔(最近一次消费)(R:Recency):上一次购买与现在间隔时间的长短消费频率(F:Frequency):一定时期内购买商品的次数(忠诚度)消费
原创
发布博客 2014.11.07 ·
1067 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

基于贝叶斯平均的产品排序方法

基于贝叶斯平均的产品排序方法做产品评测(Product Review Website)网站时会遇到如何对产品进行智能排序(smarting ranking or smarting rating)的问题。假设有10款同类型不同品牌的电风扇,网站允许登录用户对这些产品进行评论和打分,为了让其他用户更快了解哪些产品是大多数用户认同的产品,哪些是不好用的产品,就要根据用户打分情
转载
发布博客 2014.11.07 ·
768 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

mysql中的select * for update

由于InnoDB预设是Row-Level Lock,所以只有「明确」的指定主键,MySQL才会执行Row lock (只锁住被选取的资料例) ,否则MySQL将会执行Table Lock (将整个资料表单给锁住)。举个例子:假设有个表单products ,里面有id跟name二个栏位,id是主键。例1: (明确指定主键,并且有此笔资料,row lock)SELECT * FROM
转载
发布博客 2014.10.10 ·
428 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

MySQL隔离级别

SQL标准定义了4类隔离级别,包括了一些具体规则,用来限定事务内外的哪些改变是可见的,哪些是不可见的。低级别的隔离级一般支持更高的并发处理,并拥有更低的系统开销。Read Uncommitted(读取未提交内容)       在该隔离级别,所有事务都可以看到其他未提交事务的执行结果。本隔离级别很少用于实际应用,因为它的性能也不比其他级别好多少。读取未提交的数据,也被称之为脏读(Dirty
转载
发布博客 2014.10.09 ·
468 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

查看mysql表占磁盘大小

mysql 查看各表所占磁盘大小语句:
原创
发布博客 2014.10.08 ·
612 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

回归分析

一、目的
原创
发布博客 2014.09.30 ·
704 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

mysql存储过程语法及实例

存储过程如同一门程序设计语言,同样包含了数据类型、流程控制、输入和输出和它自己的函数库。--------------------基本语法--------------------一.创建存储过程create procedure sp_name()begin.........end二.调用存储过程1.基本语法:call sp_name()注意:存储过
转载
发布博客 2014.09.29 ·
478 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

mysql之触发器before和after的区别

mysql之触发器before和after的区别我们先做个测试:接上篇日志建的商品表g和订单表o和触发器假设:假设商品表有商品1,数量是10;我们往订单表插入一条记录:insert into o(gid,much) values(1,20);会发现商品1的数量变为-10了。这就是问题的所在,因为我们之前创建的触发器是after,也就是说触发的语句是在插入订单记录之后才执
转载
发布博客 2014.09.28 ·
2879 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

mysql之触发器trigger

mysql之触发器trigger触发器(trigger):监视某种情况,并触发某种操作。触发器创建语法四要素:1.监视地点(table) 2.监视事件(insert/update/delete) 3.触发时间(after/before) 4.触发事件(insert/update/delete)语法:create trigger triggerNameafter/before
转载
发布博客 2014.09.28 ·
396 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

MySQL数据导出

mysql导出数据方法一:SELECT...INTO OUTFILEmysql> select * from mytbl into outfile '/tmp/mytbl.txt';Query OK, 3 rows affected (0.00 sec)查看mytbl.txt中内容如下:mysql> system cat /tmp/mytbl.txt1       na
转载
发布博客 2014.09.26 ·
487 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

FTP,HTTP各种端口号

FTP,HTTP等各种端口号FTP,HTTPFTP的端口是 21 SSH (Secure Shell)服务使用tcp 22 端口TELNET 23 端口DHCP server的端口号是67 MAIL 的端口号是25\110 pop3\smtp 的端口号是 110/25 DNS 的端口号是 53HTTP通信用的端口号是80SMMP:性能测试标准方法
转载
发布博客 2014.09.26 ·
10175 阅读 ·
2 点赞 ·
0 评论 ·
20 收藏

Mysql 存储过程

MySQL存储过程 14.1.1 创建存储过程MySQL中,创建存储过程的基本形式如下:CREATE PROCEDURE sp_name ([proc_parameter[,...]])          [characteristic ...] routine_body 其中,sp_name参数是存储过程的名称;proc_parameter表示存储过程的参数列
转载
发布博客 2014.09.26 ·
459 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Process.waitFor()的返回值含义

以下是Linux中返回值对照表"OS error code   1:  Operation not permitted""OS error code   2:  No such file or directory""OS error code   3:  No such process""OS error code   4:  Interrupted system call"
转载
发布博客 2014.09.11 ·
15929 阅读 ·
2 点赞 ·
0 评论 ·
8 收藏
加载更多