自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(25)
  • 收藏
  • 关注

转载 【Sam Gor开堂】R语言中嘅ggplot2包之C集

啦啦啦啦~~好耐冇见!继续更新第三集!本篇文章涉及ggplot2: Elegant Graphics for Data Analysis 中的第二章 ...

2017-03-27 20:53:55 147

转载 【Sam Gor开堂】R语言中嘅ggplot2包之A集

数据嘅可视化确实非常重要,而R语言作图能力亦都相当完美!特别喺ggplt2呢个包,学熟距简直就可以直接showoff一番,未来连续几日,我都会从网路上收集d比较好嘅教材,...

2017-03-12 17:13:12 1384

转载 【Sam Gor开堂】GA算法设计最短路程-R语言

遗传算法最近唔知道点解身边总有人在提及,可能系现状物流嘅路由规划并不是十分理想咯!不过都正常,拍脑袋嘅决策来得总是那么“简单”,但后果就系配送成本一直居高不下咯,呢个时候...

2017-03-11 19:34:07 338 1

转载 【Sam Gor开堂】主成分分析——建模降维大招

呃,冇错!呢招确实喺建模时候嘅大招,研究熟悉分分钟可以相当于K.O一个Boss~喺咪咁劲啊???感兴趣咪睇落去咯!首先先讲下定义,乜喺“主成分分析”?以下定义来自国内某度...

2017-03-10 09:51:42 198

转载 follow your heart——Steve jobs

呢个演讲确实好好~所以share俾大家咯~附上演讲原文"Thank you. I'm honored to be with you today foryour comme...

2017-03-10 09:51:42 332

转载 扎克伯格:真正决定人生高度的,是你做事的速度

||今天决定给大家来煲汤了哈哈哈扎克伯格,这位全球最年轻富豪才33岁,却法力无穷。如今,他的个人资产达到480亿美元,位列全球第六富↓↓当年,面对“社交网站”这个足以带...

2017-03-09 11:32:00 224

转载 SQL数据库基础干货分享(六)

二:数据库基本概念类2 简单描述tablespace / segment / extent / block之间的关系Segments: Segment指在tablespa...

2017-03-07 08:27:11 111

转载 SQL数据库基础干货分享(七)

三:备份恢复类物理备份:热备份:alter tablespace begin/end backup;冷备份:脱机备份(database shutdown)RMAN备份fu...

2017-03-07 08:27:11 79

转载 SQL数据库基础干货分享(八)

四:系统管理类ü 查v$system_event/v$session_event/v$session_wait 从v$system_event开始,确定需要什么资源(db...

2017-03-07 08:27:11 109

转载 SQL数据库基础干货分享(九)

1. 存储过程和函数的区别2. 事务是什么?原子性:事务必须是原子工作单元;对于其数据修改,要么全都执行,要么全都不执行。一致性:事务在完成时,必须使所有的数据都保持一致...

2017-03-07 08:27:11 94

转载 SQL数据库基础干货分享(一)

一、数据库基础1. 数据抽象:物理抽象、概念抽象、视图级抽象,内模式、模式、外模式CREATE VIEW view_name AS Select * FROM Table...

2017-03-06 00:23:19 94

转载 SQL数据库基础干货分享(二)

一、二、三、表名:wu_bom查询这两个表中plan唯一,每一个plan中,amount最少的,plannum大于prixis的记录四、表2结构如下要求:先按部门排序,再...

2017-03-06 00:23:19 169

转载 SQL数据库基础干货分享(三)

1.触发器的作用?答:触发器是一中特殊的存储过程,主要是通过事件来触发而被执行的。它可以强化约束,来维护数据的完整性和一致性,可以跟踪数据库内的操作从而不允许未经许可的更...

2017-03-06 00:23:19 57

转载 SQL数据库基础干货分享(四)

在面试应聘的SQL Server数据库开发人员时,我运用了一套标准的基准技术问题。下面这些问题是我觉得能够真正有助于淘汰不合格应聘者的问题。它们按照从易到难的顺序排列。当...

2017-03-06 00:23:19 64

转载 SQL数据库基础干货分享(五)

一:SQL tuning 类Or hash join/merge join/nest loop(cluster join)/indexjoin ??ORACLE 8i,9...

2017-03-06 00:23:19 119

转载 SQL经典面试题及答案(一)

1.一道SQL语句面试题,关于group by1)select rq, sum(case when shengfu='胜' then 1 else 0 end)'胜',s...

2017-03-05 08:51:12 333

转载 利用R语言+逻辑回归实现自动化运营

利用R语言+逻辑回归实现自动化运营摘要逻辑回归是最常见的二分类算法之一,由于是有监督学习,训练阶段需要输入标签,而同时在变量较多的情况下,需要先经过一些降维处理,本文主要...

2017-03-05 08:51:12 283

转载 Vol07-优化思路小结

线上的宽表及报表,由于影响到各个业务线的数据,对数据及时性要求比较高,所以整体的运行效率显得至关重要;借鉴以往的优化经验,这里在优化方式上提供一些参考。方式一:sql优化...

2017-03-02 17:43:03 96

转载 Vol08-Hive中的行列互转-与UDTF的应用

UDTF(User-DefinedTable-Generating Functions)用来解决输入一行输出多行(On-to-manymaping) 的需求。hive...

2017-03-02 17:43:03 109

转载 Vol09-多字段多粒度count(distinct) 优化

数据处理过程中count(distinct)效率较低,数据量一多准出问题,如果是多字段count(distinct)效率更低。解决方法:使用row_number实现cou...

2017-03-02 17:43:03 695

转载 Vol06-在IDE中加载外部数据资源

数据集成开发平台近期上线了新功能—加载外部数据资源,通过同学们的反馈发现部分同学对使用的方式并不十分了解,因此本期对此功能进行一下详细的介绍。我们在数据开发工作中经常会遇...

2017-03-01 15:33:42 204

转载 Vol02-日期函数

日期函数是在Hive开发中使用比较频繁的一类函数,使用老式的from_unixtime()函数会导致全分区扫描,运行效率很低,浪费很多集群资源。数据仓库架构组新开发的sy...

2017-03-01 15:33:42 263

转载 Vol03-GDM表的使用

1. GDM表的使用GDM一般包括两种情况,全量的和增量:a)全量的表,如gdm_item_sku_prc_basic_attrib_da,使用的时候必须加分...

2017-03-01 15:33:42 386

转载 Vol04-数据倾斜

典型的业务场景1.空值产生的数据倾斜场景:如日志中,常会有信息丢失的问题,比如日志中的user_id,如果取其中的 user_id 和 用户表中的user_i...

2017-03-01 15:33:42 88

转载 Vol05-数据倾斜(下)

全站按月流量数据倾斜处理过程全站按月流量需求,表adm_s14_ol_site_m,因为数据量太大(临时表1整月的数据条数达到48亿多),导致脚本开发完成后数据倾斜,程序...

2017-03-01 15:33:42 155

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除