- 博客(67)
- 资源 (13)
- 收藏
- 关注
转载 解码知乎:知乎组织架构模型“大剖析”UGC 网站优化如何借鉴
本文深度剖析知乎目前的内容架构模型,对于社区应用开发者可将其中的架构思维推广到一般 UGC 网站产品的优化上。 知乎是目前国内用户平均素质最高的网站,其日均访问 IP 在 60 万以上。对于这样一个用户活跃度极高、产出大量优质内容(UGC)网站来说,如何把内容更好地组织呈现并将其中优质部分的价值最大化,非常重要。 基础模块(1 问题-n 回答-n 评论模块) 知乎基础模块中一个问
2015-05-28 16:37:53 1206
转载 App数据层设计及云存储使用指南
引子: 随着腾讯开放战略的实施,越来越多的第三方应用,伴随着开放平台迅速成长。在应用从小到大的发展中所遇到的各类技术问题里,涉及数据层的问题可以说是最棘手、最难解决的方面,特别是在应用进入产品高峰期时,海量用户会带来很多设计初期难以现象的访问压力。 对于不涉及到数据的接入层或者逻辑层来说,遇到问题或者故障能够较快的进行定位和解决。但是对于数据层来说,由于数据状态的存在,
2014-12-03 20:05:58 1510
转载 移动医疗盈利模式
移动医疗将带来连接功能、智能功能和体验功能三大价值,截至目前在世界范围内产生了7种能够盈利的移动医疗模式,分别是为医生提供手机临床信息,为患者提供远程医疗服务、导医服务和健康咨询,网上诊断开药,管理慢病,可穿戴设备实现监测和数据采集,运营健康大数据。由此产生的潜在收费对象包括医院、医生、患者、药企、保险公司以及其他第三方。
2014-11-17 14:27:34 874
转载 创业公司股权分配较好方案推荐
很多创业者在融资的时候,股权还没有分配好,希望专家给公司建议。PA天使投资人王利杰的建议如下:- 30%原始股根据能力和职务一次性分配,建议CEO拿到15%以上,产品,技术成员再根据资历和能力分配- 30%期权池预留,由CEO统一代持,每年根据新老员工的职位和业绩分配剩余期权的50%,这部分股份的投票权(决策权)属于CEO- 40%的股份预留给天使投资人,从内部员工优先认购
2014-11-12 16:46:13 3954
转载 SQL Server 2008 Integration Services ETL 学习笔记
SQL Server 2008 Integration Services ETL 学习笔记
2014-08-01 10:37:41 1335
转载 存储过程与函数的区别
1 存储过程 定义: 存储过程(Stored Procedure )是一组为了完成特定功能的SQL 语句集,经编译后存储在数据库中。用户通过指定存储过程的名字并给出参数(如果该存储过程带有参数)来执行它。 优 点: A 存储过程只在创造时进行编译,以后每次执行存储过程都不需再重新编译,而一般SQL语句每执行一次就编译一次,所以使用存储过程可提高数据库执行速度。 B 当对数据
2014-07-25 11:21:26 760
转载 ORACLE 常用的SQL语法和数据对象
一.数据控制语句 (DML) 部分1.INSERT (往数据表里插入记录的语句)INSERT INTO 表名(字段名1, 字段名2, ……) VALUES ( 值1, 值2, ……); INSERT INTO 表名(字段名1, 字段名2, ……) SELECT 字段名1, 字段名2, …… FROM 另外的表名;字符串类型的字段值必须用单引号括起来, 例
2014-07-16 14:50:49 529
转载 制作 OS X 10.9 USB 安装盘
创建 USB 安装盘 OS X 10.9通过 App Store 下载最新的 OS X 10.9在“应用程序”目录找到下载的 OS X 10.9 安装文件,选中并鼠标右键,菜单中选择“显示包内容”弹出的 Finder 中进入 Contents/Resources 目录在 Resources 目录下面有一个执行文件 “createinstallmedia”,把它拷贝到桌面在应用程
2014-07-15 10:28:35 1013 1
转载 大数据分析流程
这篇文章来自一个公司内部的分享,是自己所服务的业务中数据平台的发展历程,已经讲了有几个月了,最近打算挑几个点拿出来用文章的形式写出来。是自己进入公司以来参与过或者接触过的数据型项目的情况。基本包含了业务数据分析的整个流程。这篇文章纯文字描述,没有任何图呵呵。所以看我需要耐心。1、最早的数据分析可能就报表目前很多数据分析后的结果,展示的形式很多,有各种图形以及报表,最早的应该是简单的
2014-06-12 11:10:17 1713
原创 判断数据变化的标准以及预测、异常预警
判断数据变化的标准以及预测、异常预警模型: 1均值一般采用平均数。如果有偏差非常大的异常值,即不仅超过此范围,并且是远远超出平如果均数很多的异常值,则均值采用中位数替代中位数即从小到大排序时第50%n 个数。如果n为奇数,则排序后第(n+1)/2个数即为中位数如果n 为偶数,则排序后第n/2个数和第(n/2+1)个数的平均数为中位数2趋势一般采用差额分析或者比率分析法,在时
2014-06-03 11:15:58 8410 1
转载 SQL中全局变量
select @@CONNECTIONS--返回自上次启动以来连接或试图连接的次数。select @@CURSOR_ROWS--返回连接上最后打开的游标中当前存在的合格行的数量。select @@DATEFIRST--返回每周第一天的数字select @@ERROR--返回最后执行的SQL 语句的错误代码。select @@FETCH
2014-06-03 11:00:02 968
转载 最好的HTML5编码教程和参考手册推荐
最好的HTML5编码教程和参考手册推荐今天我们介绍相关HTML5的参考手册,演讲稿,电子书和教程。HTML5是新兴的web技术,虽然不是完全的新技术但是已经有很多的相关文章介绍HTML5,特别是当我们谈论HTML5将成为Flash的替代品。现代浏览器的快速开发已经刺激用户相应发展。毫无质疑,现在是学习HTML5的好时间,大多数的公司例如Google,Youtube,Facebook都已经开
2014-02-06 08:57:10 883
原创 SSRS----报表表达式、参数、变量使用
--在做点击流数据分析的过程中,有这样一种需求,参数选项可以设置不同度量,方法如下:--设定度量参数(下拉框)=IIf(Parameters!量值.Value =Switch(Parameters!量值.Value = 1, Sum(Fields!展现量.Value), Parameters!量值.Value = 2, Sum(Fields!点击量.Value),
2013-11-09 08:32:54 7409
原创 SSRS----添加计算字段,除数若为0的解决办法
SSRS开发报表添加计算字段时,当遇到除数为0的情形下,报表当中会显示: 错误号,非数字等提示,而并不是显示0如:添加计算字段表达式为: =Sum(Fields!消费.Value)/Sum(Fields!点击量.Value)当Sum(Fields!点击量.Value) 为0时便会出现上述情况解决办法如下: 报表设计面板,选择报表属性---代码-- 自定义
2013-11-07 09:27:29 2950
原创 做任何事一定要有自己的特色和优势,一定要认真付出,不能把你的工作当成任务!
做任何事一定要有自己的特色和优势,一定要认真付出,不能把你的工作当成任务!
2013-10-30 16:41:53 784
转载 SSIS----改进数据流的性能
可以配置数据流任务的下列属性,这些属性都会对性能产生影响:为缓冲区数据(BufferTempStoragePath 属性)和包含二进制大型对象 (BLOB) 数据的列(BLOBTempStoragePath 属性)指定临时存储位置。默认情况下,这些属性包含 TEMP 和 TMP 环境变量的值。您可能希望指定不同或更快的硬盘驱动器上的其他文件夹来存放临时文件,或将它们分布在多个驱动器
2013-10-28 16:30:15 11057
转载 SQL---关于master..spt_values的应用
/**最近在CSDN上见到很多关于master..spt_values的应用,感觉这个东西太好用了,所以搜索了很多关于这方面的应用。在此贴上自己的总结结果,希望各路大神批评指教,也希望大家继续把这方面的应用贴上。*/ select number from master..spt_values with(nolock) where type='P'
2013-10-18 09:02:22 1655
原创 在sql中将时间戳转换为时间类型
在sql中将时间戳转换为时间类型SQL里面有个DATEADD的函数。时间戳就是一个从1970-01-01 08:00:00到时间的相隔的秒数。所以只要把这个时间戳加上1970-01-01 08:00:00这个时间就可以得到你想要的时间了select DATEADD(second,1268738429 + 8 * 60 * 60,'1970-01-01 00:00:0
2013-10-18 08:34:13 5357
原创 ETL----如何抽取变化的数据
在初始化加载时,捕获源数据中的数据内容的变化不是很重要,因为很可能会导出整个数据源或其中的一部分。然而一旦初始加载完成,捕获源系统中的数据变化立即变成非常重要的任务。如果等到初始加载完成才开始规划数据变化的捕获技术,则将遇到很大的麻烦,捕获数据变化绝不是一个简单的任务,必须制定相应的策略来在项目中捕获源数据中不断增长的变化。 ETL 小组在后续的加载过程中负责捕获数据内容的变化
2013-10-08 10:51:56 3359 1
原创 ETL----源业务系统数据库跟踪报告
一旦源系统被确定,就要说明这些系统的意义以及谁对他们负责。下图就是为这个目的建立的图表。这个图表,也就是源系统跟踪报告,使得我们不用总是麻烦系统管理员或者业务管理者。如果走运的话,数据建模工程师将开始制作这个列表。不管谁定的初稿,这个列表的维护应该是ETL小组和数据建模小组共同努力来完成。如果在分析过程中认为一个源系统不适合作为数据仓库的源,保留它在这个列表中,并说明不使用它的原因;可能在后续阶段
2013-10-07 15:26:13 1481
原创 ETL----从源数据到数据仓库的逻辑数据映射
逻辑数据映射的组成 逻辑数据映射(见下图 )通常用一个表或者电子表格格式来表示,它包括以下特定的组成部分: 目标表名称:数据仓库中出现的物理表名称;目标列名称:数据仓库表中的列名称; 表类型:表示这个表是事实表,维表或者子维表(支节) SCD(缓慢变化维)类型:对维表,这个部分表示是类型1,类型2或者类型3的缓慢变化维。这个指标对维表中的不同的列可以是不同的。
2013-10-07 15:00:28 6543
原创 ETL----数据表规模估算表
规模估算表中列出了集结区中每张表的如下信息: 表名称。在集结区中的表或者文件的名字。在计算表中每个集结表都占用一行。 更新策略。这个字段表明表的维护方式。如果是一个永久表,可能的策略为追加数据、更新或删除。如果是临时集结表,在每个过程中都会被删减和重新加载。 加载频率。ETL 过程对表中的数据以什么样的频率加载和更改。通常是每日一次。还可以为每周、每月或者任意的时间间
2013-10-06 17:45:48 1739 1
原创 ETL----如何决定是否采用ETL工具
ETL工具还是手工编码(购买工具集还是自己写程序?) 在《智能企业》杂志的一篇精彩的文章(2003.5.31,Ralph Kimball编辑)中,Gary Nissen对这个问题总结概括后,回答是:“看情况”。我们展开来分析一下Gary的观点。 基于ETL工具的优势 根据某个ETL工具厂商的说法:“一个有价值的工具目的不在于能够解决琐碎的问题,而是要
2013-10-06 16:15:09 2666 1
转载 SQL Server 2008 - 第2章 创建、管理 数据库
第2章 创建数据库数据库是用来存储数据的空间,它作为存储结构的最高层次是其他一切数据库操作的基础。用户可以通过创建数据库来存储不同类别或者形式的数据。因此,在本章用户将详细地学习针对数据库的基本操作和数据库的日常管理操作,即如何创建数据库、对数据/日志文件进行操作、生成数据库快照等日常操作。本章学习目标:Ø 了解数据库对象及构成Ø 掌握创建数据库的两种方法Ø 掌握管理数据
2013-10-03 08:57:22 5542
转载 数据仓库多维建模笔记
《数据仓库工具箱—维度建模的完全指南》笔记一、数据仓库体系结构和建模过程、技巧关键点:数据仓库体系结构、维度建模的四个步骤、数据仓库总线结构、一致性维度。1、对于数据仓库DW来说,业务需求是第一位的。2、数据仓库的目标: 1)、随心所欲的访问数据。直观、明显、简单、易用、切割、合并、下钻、上卷; 2)、一致的展现数据(相对于原来从多个系统中出来的报表不一
2013-10-02 09:48:05 2712
转载 SQL Server-高效维护数据库的关键技巧
SQL Server高效维护数据库的关键技巧Paul S. Randal 概览:管理数据和事务日志文件清除索引碎片确保统计数据准确、最新检测遭到破坏的数据库页建立有效的备份策略 目录数据和日志文件管理 索引碎片 统计数据 损坏检测 备份 总结 在一周之内多次有人向我
2013-09-18 15:46:02 998
转载 SQL Server 2008-跟踪企业数据库中的更改
SQL Server 2008跟踪企业数据库中的更改Paul S. Randal 概览:跟踪更改的需要在 SQL Server 2005 中跟踪更改SQL Server 2008 中的更改跟踪SQL Server 2008 中的更改数据捕获 目录您如何在 SQL Server 2005 中跟踪更改 在
2013-09-18 15:41:45 1545
转载 SQL Server 2008-数据仓库查询性能
SQL Server 2008数据仓库查询性能Sunil Agarwal and Torsten Grabs and Dr. Joachim Hammer 概览:星型联接查询优化分区表并行处理ROW 和 PAGE 压缩分区对齐的索引视图较前期同类产品相比,SQL Server 2008 将提供功能更为强大的关系数据仓库,但是您可能
2013-09-18 15:34:43 1593
原创 SQL学习----关键词搜索
if exists (select * from dbo.sysobjects where id = object_id(N'[dbo].[f_search]') and xtype in (N'FN', N'IF', N'TF'))drop function [dbo].[f_search]GOif exists (select * from dbo.sysobjects where i
2013-09-18 15:26:34 1077
原创 SQL学习----日期流水号生成
--自已做标识列的例子--流水号:日期+当日编号:--创建视图,得到当前日期(因为函数中不能使用getdate())create view v_getdate as select dt=convert(varchar,getdate(),112)go--创建得到最大id的函数create function f_getid()returns varchar(12)asbegin
2013-09-18 15:18:38 1266
原创 SQL学习----添加列到指定位置
--开启系统表写功能以便创建存储过程EXEC sp_configure 'allow updates',1 RECONFIGURE WITH OVERRIDEGOCREATE PROC sp_addColumn@TableName sysname, --要添加字段的表名@FieldDefine nvarchar(1000), --要添加的列的定义,定义必
2013-09-18 15:06:25 5617
原创 SQL学习---将所有的char,varchar改为nchar,nvarchar
CREATE PROC p_ToUnicode@type tinyint=0 --修改方式,0=仅查询可修改情况,1=仅所有列可修改时才修改,2=修改可修改列,报告不可修改列ASSET NOCOUNT ON--查询非unicode列转换为unicode列的可行性SELECT TableName=o.name,FieldName=c.name, FieldType=t.name+N'(
2013-09-18 15:05:04 3576
转载 建立数据仓库---- 聚集策略
聚集策略每个数据仓库都应该包含预先计算并预先保存的聚集表。如果给定了严 格避免出现混合事实表糙度的规则,期每个独特事实表聚集都应该拥有聚集 的物理事实表。在对事实进行聚集操作时,要么消除维度性,要么将事实与 堆租维皮联系起来。这些堆积形成的聚集维度事实表应该是与基本粒度事实 表棉联系的维皮压缩版本。这样,聚集维度表与基本维度表就能保持一致。考虑建立所有可能的聚集组合是不切实际的
2013-09-17 16:41:57 1737
原创 网站流量统计分析---指标
网站流量分析 网站流量分析,是指在获得网站访问量基本数据的情况下对有关数据进行统计、分析,从中发现用户访问网站的规律,并将这些规律与网络营销策略等相结合,从而发现目前网络营销活动中可能存在的问题,并为进一步修正或重新制定网络营销策略提供依据。当然这样的定义是站在网络营销管理的角度来考虑的,如果出于其他方面的目的,对网站流量分析会有其他相应的解释。在商业行为的网站中,企业网站流量统计分析对
2013-09-16 15:26:50 5984
转载 cookie---点击流数据库
细说Cookie阅读目录开始Cookie 概述Cookie的写、读过程使用Cookie保存复杂对象Js中读写CookieCookie在Session中的应用Cookie在身份验证中的应用Cookie的安全状况如何在C#发请的请求中使用Cookie重构与使用总结补充Cookie虽然是个很简单的东西,但它又是WEB开发中一个很重要的客户端数据来源,而且它
2013-09-15 10:36:22 1269
转载 【转】SQL学习---数据库设计
数据库设计5步骤1.确定entities及relationshipsa) 明确宏观行为。数据库是用来做什么的?比如,管理雇员的信息。b) 确定entities。对于一系列的行为,确定所管理信息所涉及到的主题范围。这将变成table。比如,雇用员工,指定具体部门,确定技能等级。c) 确定relationships。分析行为,确定tables之间有何种
2013-09-14 14:50:21 969
转载 【转】SQL学习---SQL函数说明大全
一旦成功地从表中检索出数据,就需要进一步操纵这些数据,以获得有用或有意义的结果。这些要求包括:执行计算与数学运算、转换数据、解析数值、组合值和聚合一个范围内的值等。下表给出了T-SQL函数的类别和描述。函数类别作用聚合函数执行的操作是将多个值合并为一个值。例如 COUNT、SUM、MIN 和 MAX。配置函数
2013-09-14 14:45:08 1407
转载 【转】SQL学习---游标的使用
在关系数据库中,我们对于查询的思考是面向集合的。而游标打破了这一规则,游标使得我们思考方式变为逐行进行.对于类C的开发人员来着,这样的思考方式会更加舒服。 正常面向集合的思维方式是: 而对于游标来说: 这也是为什么游标是邪恶的,它会使开发人员变懒,懒得去想用面向集合的查询方式实现某些功能. 同样的,在性
2013-09-14 14:27:18 852
原创 ETL---数据清洗转化
1、数据清洗数据清洗的任务是过滤那些不符合要求的数据,将过滤的结果交给业务主管部门,确认是否过滤掉还是由业务单位修正之后再进行抽取。不符合要求的数据主要是有不完整的数据、错误的数据和重复的数据三大类。 A、不完整的数据 其特征是是一些应该有的信息缺失,如供应商的名称,分公司的名称,客户的区域信息缺失、业务系统中主表与明细表不能匹配等。需要将这一类数据过滤出来,按缺失的
2013-09-14 11:13:56 4709
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人