- 博客(25)
- 收藏
- 关注
转载 【Sam Gor开堂】R语言中嘅ggplot2包之C集
啦啦啦啦~~好耐冇见!继续更新第三集!本篇文章涉及ggplot2: Elegant Graphics for Data Analysis 中的第二章 ...
2017-03-27 20:53:55 147
转载 【Sam Gor开堂】R语言中嘅ggplot2包之A集
数据嘅可视化确实非常重要,而R语言作图能力亦都相当完美!特别喺ggplt2呢个包,学熟距简直就可以直接showoff一番,未来连续几日,我都会从网路上收集d比较好嘅教材,...
2017-03-12 17:13:12 1384
转载 【Sam Gor开堂】GA算法设计最短路程-R语言
遗传算法最近唔知道点解身边总有人在提及,可能系现状物流嘅路由规划并不是十分理想咯!不过都正常,拍脑袋嘅决策来得总是那么“简单”,但后果就系配送成本一直居高不下咯,呢个时候...
2017-03-11 19:34:07 338 1
转载 【Sam Gor开堂】主成分分析——建模降维大招
呃,冇错!呢招确实喺建模时候嘅大招,研究熟悉分分钟可以相当于K.O一个Boss~喺咪咁劲啊???感兴趣咪睇落去咯!首先先讲下定义,乜喺“主成分分析”?以下定义来自国内某度...
2017-03-10 09:51:42 198
转载 follow your heart——Steve jobs
呢个演讲确实好好~所以share俾大家咯~附上演讲原文"Thank you. I'm honored to be with you today foryour comme...
2017-03-10 09:51:42 332
转载 扎克伯格:真正决定人生高度的,是你做事的速度
||今天决定给大家来煲汤了哈哈哈扎克伯格,这位全球最年轻富豪才33岁,却法力无穷。如今,他的个人资产达到480亿美元,位列全球第六富↓↓当年,面对“社交网站”这个足以带...
2017-03-09 11:32:00 224
转载 SQL数据库基础干货分享(六)
二:数据库基本概念类2 简单描述tablespace / segment / extent / block之间的关系Segments: Segment指在tablespa...
2017-03-07 08:27:11 111
转载 SQL数据库基础干货分享(七)
三:备份恢复类物理备份:热备份:alter tablespace begin/end backup;冷备份:脱机备份(database shutdown)RMAN备份fu...
2017-03-07 08:27:11 79
转载 SQL数据库基础干货分享(八)
四:系统管理类ü 查v$system_event/v$session_event/v$session_wait 从v$system_event开始,确定需要什么资源(db...
2017-03-07 08:27:11 109
转载 SQL数据库基础干货分享(九)
1. 存储过程和函数的区别2. 事务是什么?原子性:事务必须是原子工作单元;对于其数据修改,要么全都执行,要么全都不执行。一致性:事务在完成时,必须使所有的数据都保持一致...
2017-03-07 08:27:11 94
转载 SQL数据库基础干货分享(一)
一、数据库基础1. 数据抽象:物理抽象、概念抽象、视图级抽象,内模式、模式、外模式CREATE VIEW view_name AS Select * FROM Table...
2017-03-06 00:23:19 94
转载 SQL数据库基础干货分享(二)
一、二、三、表名:wu_bom查询这两个表中plan唯一,每一个plan中,amount最少的,plannum大于prixis的记录四、表2结构如下要求:先按部门排序,再...
2017-03-06 00:23:19 169
转载 SQL数据库基础干货分享(三)
1.触发器的作用?答:触发器是一中特殊的存储过程,主要是通过事件来触发而被执行的。它可以强化约束,来维护数据的完整性和一致性,可以跟踪数据库内的操作从而不允许未经许可的更...
2017-03-06 00:23:19 57
转载 SQL数据库基础干货分享(四)
在面试应聘的SQL Server数据库开发人员时,我运用了一套标准的基准技术问题。下面这些问题是我觉得能够真正有助于淘汰不合格应聘者的问题。它们按照从易到难的顺序排列。当...
2017-03-06 00:23:19 64
转载 SQL数据库基础干货分享(五)
一:SQL tuning 类Or hash join/merge join/nest loop(cluster join)/indexjoin ??ORACLE 8i,9...
2017-03-06 00:23:19 119
转载 SQL经典面试题及答案(一)
1.一道SQL语句面试题,关于group by1)select rq, sum(case when shengfu='胜' then 1 else 0 end)'胜',s...
2017-03-05 08:51:12 333
转载 利用R语言+逻辑回归实现自动化运营
利用R语言+逻辑回归实现自动化运营摘要逻辑回归是最常见的二分类算法之一,由于是有监督学习,训练阶段需要输入标签,而同时在变量较多的情况下,需要先经过一些降维处理,本文主要...
2017-03-05 08:51:12 283
转载 Vol07-优化思路小结
线上的宽表及报表,由于影响到各个业务线的数据,对数据及时性要求比较高,所以整体的运行效率显得至关重要;借鉴以往的优化经验,这里在优化方式上提供一些参考。方式一:sql优化...
2017-03-02 17:43:03 96
转载 Vol08-Hive中的行列互转-与UDTF的应用
UDTF(User-DefinedTable-Generating Functions)用来解决输入一行输出多行(On-to-manymaping) 的需求。hive...
2017-03-02 17:43:03 109
转载 Vol09-多字段多粒度count(distinct) 优化
数据处理过程中count(distinct)效率较低,数据量一多准出问题,如果是多字段count(distinct)效率更低。解决方法:使用row_number实现cou...
2017-03-02 17:43:03 695
转载 Vol06-在IDE中加载外部数据资源
数据集成开发平台近期上线了新功能—加载外部数据资源,通过同学们的反馈发现部分同学对使用的方式并不十分了解,因此本期对此功能进行一下详细的介绍。我们在数据开发工作中经常会遇...
2017-03-01 15:33:42 204
转载 Vol02-日期函数
日期函数是在Hive开发中使用比较频繁的一类函数,使用老式的from_unixtime()函数会导致全分区扫描,运行效率很低,浪费很多集群资源。数据仓库架构组新开发的sy...
2017-03-01 15:33:42 263
转载 Vol03-GDM表的使用
1. GDM表的使用GDM一般包括两种情况,全量的和增量:a)全量的表,如gdm_item_sku_prc_basic_attrib_da,使用的时候必须加分...
2017-03-01 15:33:42 386
转载 Vol04-数据倾斜
典型的业务场景1.空值产生的数据倾斜场景:如日志中,常会有信息丢失的问题,比如日志中的user_id,如果取其中的 user_id 和 用户表中的user_i...
2017-03-01 15:33:42 88
转载 Vol05-数据倾斜(下)
全站按月流量数据倾斜处理过程全站按月流量需求,表adm_s14_ol_site_m,因为数据量太大(临时表1整月的数据条数达到48亿多),导致脚本开发完成后数据倾斜,程序...
2017-03-01 15:33:42 155
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人