- 博客(90)
- 资源 (5)
- 收藏
- 关注
原创 为什么ETL任务困难
title: 为什么ETL任务困难 summary: 自传统数据仓库理论形成,ETL 占据其中70%工作量就已经成为常识。可即便经过几十年到今天,各个平台的 ETL 普遍还在初级阶段,这背后深层次的原因是什么? tags: - BI - ETL - DW - 大数据 …为什么 ETL 很困难?工具繁多从 DataStage到Kettle, ETL 工具覆盖了商业化
2016-08-25 23:23:05 2510
原创 大数据行业现状
title: 大数据行业现状 summary: 每个人都在讲大数据,就连我们的父母辈都知道这些词汇,可是有几个人真正了解这个行业?每次的大数据会议都有成百上前人参加,可是里面有几个能称为专家?这么多人趋之若鹜的行业,为什么参加几百次会议也入不了门? tags: - 决策论 - 思维方式 …大数据行业现状这是大数据的时代,是最好的时代,也是最坏的时代。我们每个人都有机会加入这个
2016-08-23 23:38:52 1049
原创 新书地址 http://chuangshi.qq.com/read/book/83980678.html
http://chuangshi.qq.com/read/book/83980678.html
2013-07-03 12:47:50 3018
原创 IT人员转行写小白文可以么?
http://www.qidian.com/Book/2838198.aspx大约两个时辰,便轮到龙昊和林奇的考核测试了。两人分别进了不同的房间进行测试,分开之前,林奇拍了拍龙昊的肩膀嘱咐道:“龙昊,测试结束就在这里等我,千万别走开了。你就算过不了,我可以学了教你!”“嗯!” 龙昊点了点头,心中却打定主意,一定全力以赴,争取通过。走进房间,面前有一个很低的桌台,
2013-06-26 22:56:17 1294
原创 MySQL Replication可行性
Replication可行性分析FeaturesDescriptionEngineReplicateAUTO_INCREMENTVersionAUTO_INCREMENT columnALLYesUpdate AUTO_INCREMENT column by invoking a trigger or function!InnoDB
2013-02-21 23:59:50 939
翻译 Linux下Bash Shell编程
Bash Shell Programming in LinuxLinux下Bash Shell编程 Bash what?进阶的内容是什么?Okay, I grant that this page mightrepresent a leap from the familiar to the alien without much warning. Here aresome expl
2013-02-21 23:44:59 2612
原创 SQL SERVER索引维护与事务日志大小的关系
索引操作的日志记录情况索引操作完整大容量日志简单ALTER INDEX REORGANIZE完全记录完全记录完全记录ALTER INDEX REBUILD完全记录最小限度记录最小限度记录CREATE INDEX完全记录最小限度记录最小限度记录
2008-08-18 21:28:00 1409
原创 output返回值在SSIS中获取的方法
/**//*描述:开发中使用了output子句返回已更新数据,并且要在SSIS中获取该值。问题:ouptut子句,只能将相关数据输出到表变量或者表中,要么直接用output返回,那么,我如何用代码读取output直接的返回值?查找相关资料,方法仅仅是将数据存入表变量(output into ...@table)。直接运行带有output子句的sql,可以看到这些数据是可以输出的。
2008-05-25 18:33:00 1609
原创 解决sql server2005的sp2无法卸载或者重复安装时的相关错误
1、确保有sqlserver support,如果没有,安装上。2、"%ProgramFiles%/Microsoft SQL Server/90/Setup Bootstrap/ARPWrapper.exe /Remove" 或 运行该目录的ARPWrapper.exe 来删除服务。
2008-05-21 23:39:00 1591
转载 SQL Server DBA Dashboard
February 29, 2008SQL Server DBA DashboardBy Gregory A. LarsenLast month in my article (Building Custom Reporting Services Reports for SQL Server Management Studio ), I discussed that with SQL Server
2008-05-21 23:18:00 1539
原创 用pivot的简单行列转例子
--ProductID OrderMonth SubTotal --1 5 100.00 --1 6 100.00 --2 5 200.00 --2 6 200.00 --2 7 300.00 --3 5 400.00 --3 5 400.00 --set nocount on create table T1(ProductID int ,OrderMo
2008-05-21 19:25:00 1082
原创 SQL Server 文件移动方案
方案一:1. 该 DB进行完整备份.然后到sysfiles中读出需要移动文件的fileid2. 关闭SQL Server .(net stop mssqlserver)3. 将Log (ldf) 文件复制到Local Disk.4. 将SQL Server以单一用户模式开启开启 -> 运行 -> CMD -> 转移到SQL bin 文
2008-05-20 21:50:00 1070
原创 SQL Server中的count(1)运算,其中的1不是代表第一列
不可否认,order by 1,里面的1的确代表第一列,但count(1)基本等同于count(*)。可以做一个简单的验证,order by 后面跟100,假设该表没有100列,肯定报错的。但count()就不同,里面跟数字,字符串什么的,都是可以的。并且count(1)的结果,跟count(*)相同。而count(第一列)结果未必和count(*)相同。
2008-05-17 11:59:00 1357
原创 新建ssis包,保存时出错
今天同事遇到的问题及解决方法。新建ssis包,保存时出错。出错提示:Failed to save package file "C:/Documents and Settings/jacontesse/LocalSettings/Temp/tmp17.tmp" with error 0x8002801D "Library notregistered.". 解决方法:regsvr3
2008-05-15 18:54:00 1910
原创 SQL Server中,计算count(*),优化器会使用聚集索引还是非聚集索引?
如题1、对比cpu资源2、对比IO资源3、从索引存储的角度解释 说明:最近阅读资料时看到了,但具体是哪份资料已经记不清楚了。从索引存储的角度,很容易理解count(*)的计算会采用nonclustered index,但为什么在多个非聚集索引存在时,优化器中选索引号最大的一个非聚集索引?这个问题还没找到确切的资料证明。索引关于这方面知识的整理稍后才能发布。同时也希望大家能够对该
2008-05-15 18:38:00 945
原创 cte递归的小例子
/**//* --王红波描述:使用通用表达式实现递归查询查询id=2的所有子节点*/if exists(select 1 from sys.tables where name = test) drop table testcreate table test(id int ,parent_id int)insert into test select 1,0union allse
2008-05-07 22:49:00 2299
原创 给函数设置默认值,取身份证号的年龄
以前写的,在求年龄时,其实还有些符号需要处理,比如$,可以参考下。同时,我对身份证号没没有去全面的研究,只是能在我们环境中满足需求。 关于函数到底是否可以设默认值,我以前看到有些资料上说不能设置。也许是从别的角度考虑吧,只是这个默认值是真的不彻底,起码存储过程有默认值的参数可以不传值,但函数至少要传个default进去。我只是认为默认值是可以设置,但调用时不够理想而已。 --王红波 /
2008-05-07 20:32:00 1311
原创 SQL Server2005中删除重复行
以前写的东西,可以看看思路 /**//*删除表中重复行的方法*/if exists(select 1 from sys.tables where name=t_dup) drop table t_dupgocreate table t_dup(id int,age int,name varchar(32))insert into t_dupselect 1,1,auni
2008-05-07 20:23:00 2284 7
原创 SQL Server2005中的聚集索引必定唯一
前几天看Inside SQL Server Storage关于索引的讲解时,提到说SQL Server2005聚集索引一定是惟一的。如果在创建聚集索引时不使用unique关键字,系统会给重复的索引键加一个4字节长度的附件信息,让索引键惟一。由于自己近期的空余时间不多,学习的资料没来得及系统的整理,所以只提这么点,大家可以查看索引页的具体内容。使用dbcc inc查看索引页信息,应该可以证实这一点。
2008-05-07 20:17:00 827
原创 用SQL获取月份的工作日
declare @int_month int,@max_day int,@strDate varchar(10)set @int_month=7 --输入月份if @int_month between 1 and 12beginselect @strDate=cast(year(getdate()) as varchar(10))+-+cast(@int_month+1 as varcha
2008-04-25 20:15:00 2452
原创 SQL Server2005中IN运算的一个错误
/**//*测试in运算容易出错的一种情况,就是在子查询中的查询列实际不存在,会返回所有数据*/create table t_1(uid int)create table t_2(id int)insert into t_1select 1union all select 2union allselect 3union all select 4insert into t_2select
2008-04-25 19:50:00 830 1
原创 SQL Server日期格式处理-把14位字符串返回成日期格式
/**//*描述:14位字符串转化成日期格式输出DEMO:select dbo.fn_get_datetime_from_char14(20080304110102)*/create function fn_get_datetime_from_char14(@c_date varchar(14))returns datetimeasbegindeclare @date varchar
2008-04-25 15:07:00 2404
原创 用sql求三个数的最大值
--没见别人这样用,但起码可以达到目的,不知道有没简单的方法,不想建表。 select @data_end_tag=max(tag) from ( select @end_tag_ctc1 as tag union select @end_tag_ctc2 as tag union select @end_tag_cnc1 as tag union select @end_tag_cnc
2008-04-24 21:01:00 6649
原创 用sql求一组数据中的3个和最小的数值
/**//*描述:获取一组数据中3个和的绝对值最小的数据 在测试中,输入了有重复值的数据,有重复时,只当作一个数字原题:N个int数,求其中三个数,使得其和的绝对值最小,如{-3,9,-5,90}的三个数是{-3,9,-5},要求分析时间和空间复杂度。*/set nocount on if exists(select 1 from sys.tables where name =
2008-04-24 20:55:00 3354
原创 SQL Server2005维护计划一种错误的处理方式
/**//*-----------------------------问题描述:MsSqlServer2005中,由于计算机名修改或者删除、修改或重建维护计划的误操作引起系统中有无法删除的维护计划,错误提示类似于:“DELETE语句与 REFERENCE约束"FK_subplan_job_id"冲突。该冲突发生于数据库"msdb",表"dbo.sysmaintplan_subplans"
2008-04-24 20:43:00 2185
原创 SqlServer2005中文本查询的最佳处理方式
注,本文是我早期工作时写的,主要是个思路问题,结论并不合理。这里仅记录我当时的想法和思路,不该以本文的结论处理在线项目了。其实几种处理方法的优劣,跟实际操作数据量以及硬件等环境有很大关系,数据量叫大的时候,like %a%这样的方式相对效率还可以。当然,对于文本处理,全文搜索还有优势,但全文搜索也有一定的局限性,中文的分词方式,的确较复杂,所以具体问题,参考各种方式,还是该具体对待。
2008-04-24 20:41:00 902
原创 SQL Server搭建模拟环境进行测试
接触数据库早期写的东西,初学者可以看看。 一、接口部分 SET ANSI_NULLS ONGOSET QUOTED_IDENTIFIER ONGOIF NOT EXISTS (SELECT * FROM dbo.sysobjects WHERE id = OBJECT_ID(N[dbo].[PrMatch_Construct]) AND OBJECTPROPERTY(id,NIsPr
2008-04-24 20:08:00 2128
原创 用TSQL求子串在父串中出现的次数
http://database.ctocio.com.cn/tips/121/8055121.shtml用TSQL求子串在父串中出现的次数 作者:王红波,干露摘要 本文以实例说明网络上常见的求子字符串在父字符串中出现次数的函数中存在的错误以及修改和优化的方法。针对日常工作所需功能,网络上流传着很多已有资源
2008-04-15 19:16:00 1034
原创 SQL Server索引维护指导
http://database.ctocio.com.cn/tips/69/8078069.shtml SQL Server索引维护指导作者:王红波摘要本文以笔者在实际工作中对SQL Server数据库种索引维护的思路和方法为导向,为大家介绍SQL Server索引维护相关的知识和方法。导言索引在数据库相关工作者的日常工作中占据了很重要的位置,索引需要牵涉到索引创建、优化和维护多方面
2008-04-15 19:15:00 731
原创 传说中年薪30万的面试题
小明和小强都是张老师的学生,张老师的生日是M月N日,2人都知道张老师的生日 是下列10组中的一天,张老师把M值告诉了小明,把N值告诉了小强,张老师问他们知道他的生日是那一天吗? 3月4日 3月5日 3月8日 6月4日 6月7日 9月1日 9月5日 12月1日 12月2日 12月8日 小明说:如果我不知道的话,小强肯定也不知道 小强说:本来我也不知道,但是现在我知道了 小明说:哦,那我也知道了 请根
2006-02-16 20:43:00 1611
原创 关于函数重载笔记002
using 声明怎样影响重载函数呢using 声明为一个名字空间的成员在该声明出现的域中提供了一个别名下面程序中的using 声明会怎么样呢namespace libs_R_us {int max( int, int );int max( double, double );extern void print( int );extern void print( double );}// using
2006-01-20 19:07:00 1221
原创 关于函数重载解析笔记001
当一个函数在一个特定的域中被多次声明时,编译器解析第二个及后面函数依照下面步骤:1.参数个数或类型不同,则认为是重载 // 重载函数 void print( const string & ); void print( vector & );2.函数返回类型和参数表完全相同,则认为第二个函数是第一个函数的重复声明 参数表的比较过程与参数名无关3.如果两个函数的参数表相同但是返回类型不同则第一个声
2006-01-20 19:06:00 1585
原创 影片>
一部很不错的电影.感人,这是一定的,里面介绍的是抬头村的一个刘百刚,从小希望飞上蓝天,在这个过程坚持不谢,为自己的理想抛开世俗的一切. 我被他感动,是因为他为自己的理想,放弃亲情,爱情,是那么坦然。我想,他所做的,才算真的有理想。当然从故事中我也看出,像他这样一个很有才华,很有理想的人。几乎难以被世俗接受,被别人认为“有病”,我认为这是非常现实的问题。在目前的社会现实中,多数人都默守陈规,对
2006-01-04 13:01:00 1277 1
原创 存储过程默认参数
create proc test@inta int,@intb int=0asset nocount on begin return @inta+@intbend--demodeclare @intReturnValue intexec @intReturnValue=test 3select @intReturnValueexec @intReturnValue=test 3,2select @
2005-12-30 18:58:00 1282
原创 最大公约数,最小公倍数
// win32_MyFun.cpp : 定义控制台应用程序的入口点。////y2k051229//whbo//vc++7.0.net////#include #include "stdafx.h"using namespace std; inline int _max(int a,int b); inline int _min(int a,int b); int _gys(int a,int b
2005-12-30 18:52:00 1095
原创 这个csdn,发个东西都得几次
最近整理的东西比较多的,应该比前几个月都多,不过对这个blog实在不敢恭维,发起来也麻烦,所以,还是丢给我自己的mybase所以朋友不要担心我堕落,不是我在堕落,我依然在努力思索.年轻人,要有所作为....
2005-12-08 18:14:00 1010
原创 统计一个数据库中的每个表的记录数
--varchar可以存8k字符;nvarchar可以存4k字符(UNICODE)DECLARE @chvSqlCmd varchar(8000)SET @chvSqlCmd=SELECT @chvSqlCmd=@chvSqlCmd+SELECT +NAME+,COUNT(*) FROM +NAME+CHAR(13)+UNION+CHAR(13)FROM DBO.SYSOB
2005-11-24 11:50:00 1475
sublime 最新版本
2017-02-21
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人