AricZhou

致力于数据处理，包括数据库开发、设计与建模、报表开发、ETL、数据仓库、数据挖掘、数据分析、BI、数据可视化等等

原创 SqlServer执行计划

阅读目录开始SQL Server 查找记录的方法SQL Server Join 方式更具体执行过程索引统计信息：查询计划的选择依据优化视图查询推荐阅读-MSDN文章对于SQL Server的优化来说，优化查询可能是很常见的事情。由于数据库的优化，本身也是一个涉及面比较的广的话题，因此本文只谈优化查询时如何看懂SQL Server查询计划。毕竟我对SQL Server的认识

2015-12-22 09:43:49 1282

原创药店运营| 品类管理——构建采购模型：补货策略

零售连锁企业的补货策略模型是影响“缺货、滞销”的重要因素，也是“库存资金占用”调整的重要策略。缺货营销销售，滞销影响资金占用、增加过期风险。二者都是企业时刻关注的焦点。备货数量合理与否，最直接的因素就是“采购模型（或称补货模型）”。虽然不能消灭缺货和滞销，但是可以通过科学的补货模型，尽量减少二者对经营的影响。

2015-11-06 14:27:02 4058

在搜索文献的过程中，我喜欢上了经济学人的《graphic details》栏目，发现他们绘制的图非常漂亮、专业，然后我就开始学习excel，尽自己所能将excel图表做的更漂亮更专业，这些经历为我日后做数据可视化打下了坚实的基础，我知道了商务色彩搭配及图表的综合简洁等，我知道怎么将自己与别人做的图表专业的区分开来。后来看了大前研一先生的著作，了解到了专业精神，我曾经写下这样一句话，以此勉励自己：所谓专业即每一个细节都经得起推敲

2015-11-05 15:26:34 3203

原创 Java NIO通信框架: Netty

通信是软件最基础的功能之一，Netty是最流行的Java NIO通信框架，因此它的使用范围非常广

2015-11-04 09:31:22 908

转载使用Scrapy来爬取自己的CSDN文章

前言爬虫作为一中数据搜集获取手段，在大数据的背景下，更加得到应用。我在这里只是记录学习的简单的例子。大牛可以直接使用python的url2模块直接抓下来页面，然后自己使用正则来处理，我这个技术屌丝只能依赖于框架，在这里我使用的是Scrapy。install首先是python的安装和pip的安装。 sudo apt-get install python python-pi

2015-10-09 10:37:26 875

转载如何用思维导图软件做进度计划？

WBS工作结构分解是对项目范围的一种逐级分解的层次化结构编码。根据PMBOK定义，分解指把主要可交付成果分成较小的，便于管理的组成部分，直到可交付成果定义明晰到足以支持各项项目活动（规划、实施、控制和收尾）的制订。在实际项目管理中，我们通常需要进行WBS工作分解，它是编辑项目进度计划的基础。一些项目经理会先进行WBS分解，然后根据分解的内容编制进度计划。从我接触的项目经理来看，都是直接在Project软件上，边进行WBS分解，边做计划。这种做法难免会影响思路，造成遗漏。Mindmanager是思维导图的一种

2015-10-09 10:04:42 3866

原创 SQL优化案例-1

只是一个简单的案例，但是是真实案例，而且比较常用，还是值得收藏的。

2015-10-08 17:15:37 1015

原创 MYSQL group by 分组后只取最大、最小值对应的记录方法

这里有2篇文章综合起来就差不多了工作忙没时间整理其实和其它数据库一样并没有什么捷径效率的话还是join比较快MYSQL每个用户取1条记录的三种写法（group by xxx）同学问我关于这方面的SQL语句，我特意记忆一下，毕竟这个也比较常见了 [sql] select * from (select * from member_payment

2015-09-29 16:43:33 74262 6

转载 shell脚本: linux系统的负载与CPU、内存、硬盘、用户数监控

脚本说明：# 服务器CPU/MEM/DISK监控脚本(server_moniter.sh) #------------------------------------------------------------------ # 对服务器的CPU/MEM/DISK设定阈值，动态监控利用率，超过阈值发送邮件 # 或者短信告警 # # 本脚本通过调用watch_mem函数实现内存利用率监控，这里的内存利用率计算是进程实# 际使用的内存，也就是used-buffer/cache，超过阈值发送息。

2015-09-29 15:53:53 3598

转载 MySQL索引：查看、创建、删除、使用技巧

6．什么情况下使用索引表的主关键字自动建立唯一索引如zl_yhjbqk（用户基本情况）中的hbs_bh（户标识编号）表的字段唯一约束ORACLE利用索引来保证数据的完整性如lc_hj（流程环节）中的lc_bh+hj_sx（流程编号+环节顺序）直接条件查询的字段在SQL中用于条件约束的字段如zl_yhjbqk（用户基本情况）中的qc_bh（区册编号）select * from zl_yhjbqk where qc_bh=’7001’查询中与其它表关联的字段

2015-09-29 15:12:58 614

转载 MySQL存储过程调试工具-dbForge Studio for MySQL

工具官网地址：http://www.devart.com/dbforge/mysql/studio/ 对于某些存储过程很多且复杂的SQL的应用，在短时间内要使得所有MySQL存储过程和函数正常运行，那么如果能找到一个比较好的调试工具，就可以事半功倍，这里介绍的是dbForge Studio for MySQL。1. 首先说明dbForge Studio for My

2015-09-28 14:51:52 1066

原创 mysql: update from set

在mysql中，用一个表的字段去更新另一个表的字段：

2015-09-25 14:47:57 920

原创在职研究生

目前，在职人员可以通过三种方式报考在职研究生，以下是三种方式获得学位、考试难易度以及学费等方面的对比情况，考生可以根据自己的实际情况选择适合的方式攻读在职研究生。

2015-09-24 12:51:33 1213

转载 Ubuntu 12.04.5 简单快捷安装jdk + tomcat +Mysql

准备apache-tomcat-6.0.44.tar.gz和jdk-7u80-linux-x64.tar.gz包在/usr/local目录下创建 Java文件夹，把jdk-7u80-linux-x64.tar.gz解压放里面在/usr/local目录下创建 Tomcat文件夹，把apache-tomcat-6.0.44.tar.gz解压放里面在/

2015-09-19 14:03:43 684

转载 mysql 5.6 存储过程+事务+游标+错误异常抛出+日志写入

DELIMITER $$USE `ecstore`$$DROP PROCEDURE IF EXISTS `proc_add_warranty_card`$$CREATE DEFINER=`root`@`localhost` PROCEDURE `proc_add_warranty_card`()BEGIN -- 获取异常信息 DECLARE v_sql1

2015-09-19 14:00:10 6764

转载嵌套循环连接(Nested Loops), 合并联接(Merge), 哈希联接(Hash)的适用情况

1.嵌套循环连接(Nested Loops)适用范围两个表, 一个叫外部表, 一个叫内部表.如果外部输入非常小，而内部输入非常大并且已预先建立索引，那么嵌套循环联接将特别有效率。关于连接时哪个表为outer表，哪个为inner表，我发现sql server会自动给你安排，和你写的位置无关，它自动选择数据量小的表为outer表，数据量大的表为inner表。2.合并联接(Merge)指两个表在on的过滤条件上都有索引, 都是有序的, 这样, join时, sql server就会使用Merg

2015-09-17 23:43:27 2383

转载 SQL Server: SELECT * 的真相: 索引覆盖(index coverage)

SELECT * 将造成表/索引扫描SELECT * 的最大问题是将影响查询计划。SQL Server主要使用索引去查询你需要的数据，当索引包括所有的你请求查询的字段，SQL Server将不需要去在表中查询。这个概念称做索引覆盖。在上面的例子中，第一个查询结果是在聚集索引扫描中，反过来，第二个例子使用了更多更有效率的索引扫描。在这个案例中，索引扫描比聚集索引扫描快100倍。

2015-09-17 23:35:21 2344

转载 SQL Server书签查找

当优化器所选择的非聚簇索引只包含查询请求的一部分字段时，就需要一个查找（lookup）来检索其他字段来满足请求。对一个有聚簇索引的表来说是一个键查找（key lookup），对一个堆表来说是一个RID查找（RID lookup）。这种查找即是——书签查找。

2015-09-17 23:27:27 1018

转载 SQL Server中的三种物理连接图文解析:Loop Join,Merge Join,Hash Join

在SQL Server中，我们所常见的表与表之间的Inner Join,Outer Join都会被执行引擎根据所选的列，数据上是否有索引，所选数据的选择性转化为Loop Join,Merge Join,Hash Join这三种物理连接中的一种。理解这三种物理连接是理解在表连接时解决性能问题的基础，下面我来对这三种连接的原理，适用场景进行描述。

2015-09-17 23:17:12 1273

转载 SQL Server中扫描（scan）和查找（seek）这两种算法的区别

SQL SERVER使用扫描（scan）和查找（seek）这两种算法从数据表和索引中读取数据。这两种算法构成了查询的基础，几乎无处不在。Scan会扫描并且返回整个表或整个索引。而seek则更有效率，根据谓词（predicate），只返索引内的一个或多个范围内的数据。

2015-09-17 22:52:11 3234

翻译 SQL server 内部实三种类型的物理连接运算：Merge join、Hash join、Nested loop join对比分析

SQL server 内部实现了三种类型的内连接运算，大多数人从来没有听说过这些连接类型，因为它们不是逻辑连接也很少被用于代码中。那么它们什么时候会被用到呢？答案是要依情况而定。这就意味着要依赖于记录集和索引。查询优化器总是智能的选择最优的物理连接类型。我们知道SQL优化器创建一个计划开销是基于查询开销的，并依据此来选择最佳连接类型。那查询优化器究竟是怎样从内部选择连接类型的呢？ SQLServer在内部为查询优化器对连接类型的选择实现了一些算法，让我们来看下面的一些练习示

2015-09-17 22:11:01 961

转载 SQL Server 三大物理连接算法（嵌套，合并，哈希)的IO成本总结

1. Nested Loop Join(嵌套循环联结)　　算法：　　其思路相当的简单和直接：对于关系R的每个元组 r 将其与关系S的每个元组 s 在JOIN条件的字段上直接比较并筛选出符合条件的元组。写成伪代码就是：　　代价：　　被联结的表所处内层或外层的顺序对磁盘I/O开销有着非常重要的影响。而CPU开销相对来说影响较小，主要是元组读入内存以后(in-memory)的开销，是 O (n * m)

2015-09-17 11:42:36 1447

原创 SQL删除数据总结

想删除部分数据行用delete,注意带上where子句. 回滚段要足够大. 想删除表,当然用drop 想保留表而将所有数据删除. 如果和事务无关,用truncate即可. 如果和事务有关,或者想触发trigger,还是用delete如果是整理表内部的碎片,可以用truncate跟上reuse stroage,再重新导入/插入数据。

2015-09-11 21:43:27 923

转载 Intel李锐：Hive on Spark解析

Hive是基于Hadoop平台的数据仓库，最初由Facebook开发，在经过多年发展之后，已经成为Hadoop事实上的SQL引擎标准。相较于其他诸如Impala、Shark（SparkSQL的前身）等引擎而言，Hive拥有更为广泛的用户基础以及对SQL语法更全面的支持。Hive最初的计算引擎为MapReduce，受限于其自身的Map+Reduce计算模式，以及不够充分的大内利用，MapReduce

2015-08-31 20:05:57 1385

转载 Hive on Spark编程入门指南

先说明一下，这里说的Hive on Spark是Hive跑在Spark上，用的是Spark执行引擎，而不是MapReduce，和Hive on Tez的道理一样。　　从Hive 1.1版本开始，Hive on Spark已经成为Hive代码的一部分了，并且在spark分支上面，可以看这里https://github.com/apache/hive/tree/spark，并会定期的移到m

2015-08-31 20:02:29 2064 2

转载 Myeclipse注册码

MyEclipse提示过期:MyEclipse Trial Expired 方法：使用一个注册类生成Myeclipse注册码import java.io.*; public class MyEclipseGen { private static final String LL = "Decompiling this copyrighted

2015-08-30 12:41:25 696

原创 MySQL: [Err] 1366 - Incorrect decimal value: '' for column '' at row -1

mysql 错误1366：插入一行不报错插入多行报错

2015-08-21 15:21:08 13692

原创 mysql :转义字符

INSERT INTO `stu` ( `sno`, `sname`, `password`, `parentpd`, `ssex`, `cid`, `cname`, `gid`, `grade`, `syid`, `syear`, `group`, `groupleader`, `post`, `ispass`, `syearover`) VALUES ('20100101', 'cccc',

2015-08-19 16:39:28 1074

转载滴滴顺风车产品设计

顺风车项目初期，产品GM反复和我们强调业务使命，私家车出行在滴滴体系中的角色，私家车市场规模，业务模式概述，业务模式关键词，目标体系.使得我们很快明确了顺风车的产品定义，目标用户，主要功能，产品场景，产品特色和竞品的差异化以及未来顺风车的产品走向. 未来它将是一个每天改变千万人次出行的产品，它能让共享私家车成为一种连接人与人的生活方式.我在网上收集资料，对顺风车已经有了一

2015-08-18 20:58:31 5056 1

原创学数据库钱途怎么样？学什么数据库好呢？

牛新庄博士，是国内顶尖数据库维护、优化和架构专家，以217万年薪受聘于中国建行总行资深技术专家，在国内的金融六大行、证券、保险、电信、邮政、移动等行业，以及青岛海尔、云南红塔、中远集团、上海宝钢等知名企业做数据库的设计、维护、问题诊断和性能调优。-- 从上面我们可以看出钱途肯定是有的，还不菲。当然低层的可能就和普通的程序员没撒区别了。目前市场上虽然有Oracle，DB2，

2015-08-16 18:09:05 925

原创做技术是否需要培训、考证

很多人会觉得技术牛就行，其它都是虚的。这个不是是错的只是觉得对多数人来说是不适用的，Why?其实你只要想一件事情，学习动力从哪里来？-- 钱，对这个很俗气，却为大数人所追求的东西，最靠谱不是！到现在为止，我一直认为考认证是一个很好的学习动力。因为考试费用不菲，如果不想浪费钱只能拼命看书。

2015-08-16 17:42:51 558

转载 Java：回调函数

回调函数，第一次见是在Java编程思想中，以及后来的观察者模式也应用了回调函数的思想。但是一直都没有重视，终于在一次面试的时候吃亏了，越来越理解为什么很多人说Java编程思想这本书要一遍遍的看，吃透！首先在网络上搜索很多文章介绍什么是回调函数，看的云里雾里的。后来自己一步步分解终于理解了，记录如下。从维基百科上面摘抄定义：（看完本篇文章再来理解这个定

2015-08-15 14:35:37 461

原创数据库高可用：企业数据库高可用性架构设计

1. 本地高可用2. 异地容灾3. 备份恢复方案

2015-08-13 13:13:58 2545

原创数据库备份与恢复：冷备和热备

1、冷备时，数据库为mount模式，不需要开启归档，还原时只能还原到冷备时数据，备份数据库需要停库，也无法做到还原到任意时间点。2、热备，也就是通常用的方法，数据库正常运行，开启归档，保证了数据库能够还原到任意时间点，（归档日志为在线重做日志导出的离线数据），当在做恢复操作时，可以根据需求追加归档日志恢复到一个时间点，这种备份不需要数据库停库。

2015-08-13 13:08:20 6521

原创数据库备份与恢复：数据量大的库怎么考虑设计备份策略？

数据量大的库如果在时间和空间允许的情况下采用与常规大小库备份策略一样即可，如果在备份时间过长，备份介质过大的情况下，可以采用表空间备份+备份压缩的方式，每天备份不同的表空间，但恢复操作比较麻烦

2015-08-13 13:02:57 2629

转载如何选择满足企业发展需求的SQL on Hadoop系统

在批处理时代，Hive一枝独秀；在实时交互式查询时代，呈现出的是百花齐放的局面。Hive on Tez, Hive on Spark, Spark SQL, Impala等等，目前看也没有谁干掉谁的趋势。引用今年图灵奖得主MichaelStonebraker的话说，现在的数据库领域已经不是”one size fit all”的时代了。那么面对这么多系统，我们改如何选择呢？这里谈谈这些系统的区别

2015-08-09 16:29:18 1052

转载 SequoiaDB（巨杉数据库）成为国内首家Spark认证数据库

近日，Spark的官方博客中刊登了其全球战略合作伙伴SequoiaDB发布的技术博客，介绍SequoiaDB对于Spark的整合以及SequoiaDB+Spark的解决方案。而SequoiaDB也成为了Spark官方认证的全球合作伙伴和授权的Spark提供商之一，目前获得这一认证的企业全球仅有14家，SequoiaDB也成为国内唯一获得该认证的数据库。Spark是新一代的大数据分析处理架构

2015-08-09 16:21:32 1693

转载 JavaScript面向对象精要

数据类型在JavaScript中，数据类型分为两类：原始类型：保存一些简单数据，如true，5等。JavaScript共有5中原始类型： boolean：布尔，值为true或falsenumber：数字，值为任何整型会浮点数值string：字符串，值为由单引号或双引号括出的单个字符或连续字符（JavaScript不区分字符类型）null：空类型，其仅有一个值：nulllun

2015-08-09 16:17:15 895

转载 windows下mysql忘记root密码的解决方法

方法一： 1、在DOS窗口下输入net stop mysql5 或 net stop mysql 2、开一个DOS窗口，这个需要切换到mysql的bin目录。一般在bin目录里面创建一个批处理1.bat,内容是cmd.exe运行一下即可就切换到当前目录，然后输入mysqld-nt --skip-grant-tables; 3、再开一个DOS窗口，mysql -u r

2015-08-09 14:08:19 678

转载闲谈集群管理模式

Docker很火很红，简直到了没有道理的地步了。Docker为什么这么红？因为它是一种可以用来掀桌子的技术。在部署自动化这条产业上的工人和机床制造商们，看家护院的 cmdb，分布式脚本执行等所谓核心技术即便不会变成明日黄花，也会沦为二流技术。仅仅把 Docker 当成一个轻量级 vmware 来使用，是没法看穿其实质的。要理解 Docker 的意义，不能从 Docker 是什么，能够干什么说起

2015-08-08 19:23:49 856

SQL Server 2005的各种限制，table可容纳列数

2014-03-04

给存储过程传递一个表

2014-03-04

SQL_Server_SSAS_MDX_翻译资料

项目需要用MDX，所以翻译了Professional Microsoft SQL Server 2012 Analysis Services with MDX and DAX.pdf中第II部分第三章的内容。有翻译不当之处请联系QQ：185633513或发送EMAIL:yubinsure@gmail.com进行修正。

2014-03-04

jdk7.0新特性

对集合的支持对资源的自动回收管理泛型实例创建过程中类型引用的简化当声明你的对象的接口是，你肯定是不想重复指明泛型类型在数字中使用下划线

2012-08-22

麻将判胡程序

题目：麻将判胡程序输入：整数数组a，长度为14 输出：若数组a中的元素满足如下模式： n1 n1+1 n1+2 ... nk nk+1 nk+2 ... nt nt 则输出true，否则输出false 例：输入为：1 2 2 3 3 3 4 4 4 4 5 7 8 9 输入可拆分为： 1 2 3 3 4 5 2 3 4 7 8 9 4 4 所以输出true

2012-08-22

OCJP注册方法文档

Oracle

2012-08-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人