购物单与怀孕预测:数据分析相关性分析案例三 购物单与怀孕预测大数据相关关系分析的极致,非美国折扣零售商塔吉特莫属了。该公司使用大数据的相关关系分析已有多年。《纽约时报》记者查尔斯.杜西格就在一份报道中阐述了塔吉特(Target)公司怎样在完全不和准妈妈对话的前提下预测一个女性什么时候怀孕。基本上来说,就是搜集一个人可以搜集到的所有数据,然后通过相关关系分析得出事情的真实状况。对于零售商来说,指导一个顾客是否怀孕是非常重要的。
飓风和蛋挞:数据分析相关性分析案例二 沃尔玛:把蛋挞和飓风用品一起卖 在网络带来巨大的数据库之前,沃尔玛在美国企业中拥有的数据资源应该是最多的。20世纪90年代,沃尔玛让供应商监控销售速率、数量以及存货的情况,并通过打造透明度来迫使供应商照顾好自己的物流。在许多情况下,沃尔玛不接受产品的“所有权”,这样就避免了存货的风险也降低了成本。实际上,沃尔玛运用这些数据使其成为了世界上最大的“寄售店”。2004年,沃尔玛对过去
啤酒与尿布:数据分析相关性分析案例一 啤酒与尿布在一家超市中,人们发现了一个特别有趣的现象:尿布与啤酒这两种风马牛不相及的商品居然摆在一起。但这一奇怪的举措居然使尿布和啤酒的稍量大幅增加了。这可不是一个笑话,而是一直被商家所津津乐道的发生在美国沃尔玛连锁超市的真实案例。原来,美国的妇女通常在家照顾孩子,所以她们经常会嘱咐丈夫在下班回家的路上为孩子买尿布,而丈夫在买尿布的同时又会顺手购买自己爱喝的啤酒。这个发
大数据时代的思维转变 大数据时代,需要转变3种思维:1、需要全体数据,而不是所有数据的随机样本过去,因为技术和资源所限,我们无奈选择了随机样本的方式,随着时间的推移,后来的人们似乎忘记了这一点,他们似乎认为随机样本是统计的唯一途径。随着数据存储和处理能力技术的发展,大数据时代随之到来成为必然。2、接受数据的不精确性,接受混杂因为我们采用随机样本的方法,为了提高统计的精确性,数据必然也要精益求精,
编程经典书籍推荐:重构 改善既有代码的设计 《重构改善既有代码的设计》,英文书名Refactoring: Improving the Design of Existing Code,与《设计模式》齐名,出版于1999年。作者Martin Flowler,世界著名的面向对象技术专家,敏捷开发创始人之一。该书从出版至今,赢得了无数人的赞誉,在世界范围内畅销不衰。中文版译者是熊节,译文准确、文笔流畅,值得购买。重构这个词听来有
感恩节:美国人的春节 对中国人来说,中秋节很重要,但最重要的要算春节。那如果问你:美国人最重要的节日是什么呢?很多人会回答圣诞节,其实那是我们受到欧美影视剧的影响。事实上,圣诞节是欧美地区最重要的节日,对于美国人来说,感恩节才最重要,感恩节(Thanksgiving Day)是美国独有的传统节日,也更为纯粹,因为感恩节没有圣诞节的宗教色彩和独立日的政治背景。当今美国以自由和民主影响世界,为什么美国是自由
VS2010与水晶报表V13的打包集成小结 感谢孟子E章提供的技术咨询。系统配置: Windows 7 + VS2010 , WinForm + DotNet4 + 水晶报表这里说的打包集成,指的用VS2010的制作的安装包,在安装的时候可以顺带安装水晶报表V13,有这么三种方法:一、使用水晶报表V13合并模块举例:CRRuntime_13_0_1.msm具体步骤请参考官方文档,网址如下:http://wiki.sd
方舟子质疑360事件分析 下面对方舟子质疑360产品的事件做一些个人分析:1、 方舟子打击360,是个人行为还是受人指使?(1)从方舟子以往的打假事件来看,打击的都是个人,此次把矛头指向360,和方舟子的一贯作风是极不符的。(2)从方舟子所指控的内容来看,部分指控不成立,并且通过实验很容易被驳倒,不仅不能伤到对手,反而令自己的智商受到群众的质疑。如果指控360是方舟子个人行为,我想他不会这么不顾及生化博士
搜索引擎域名谁最强? 数天前,360以近300万的价格购得两个域名 sou.com和sou.cn,紧接着又耗巨资从海外购得域名so.com,这个域名被某些人誉为搜索域名之王,其实有些言过其实。道理很简单,两句话就能说清楚:比如汽车是一种商品,奔驰、宝马、奇瑞是汽车的品牌,但你听说过“汽车牌”的汽车吗?例子虽不是太恰当,法律也不允许这样命名,但或多或少说明了一些问题。 现实也是如此,“百度”和“谷歌”这两个名字
百度改了,搜狗还没有改 我说的是搜索引擎的一个小细节:打开搜狗首页,输入关键字“聊厕”,这时候忽然想看看关于”聊厕“的新闻,顺手点了”新闻“,结果主页上已经输入的关键字丢了,还要重新一遍。很小的一个问题,之前百度也是这样,不过上个月已经改掉了,老大这么听劝,你搜狗耳根咋这么硬呢?
2012年上半年的系统分析师考试小结 5月份参加了2012年上半年的系统分析师考试,成绩早先就知道,因为分数线没有出来,一直没有写小结,QQ群里有个在校大学生让我分享一下考试经验,我建议他工作几年之后再考,到时会觉得容易很多。 上午的基础知识考了62分,下午的分析题51分,论文47分,满分75分,45分及格,考的还行。1、 基础知识内容庞杂,除了操作系统、系统结构、计算机网络、数据库、软件工程、软件架构、经济管理、应用
COM+队列的C#实现 以前在给学生讲解COM+队列服务的时候,曾举了个例子:比如你想给张三一记耳光,但张三不在眼前,明天才会来,可明天你又不在,怎么也碰不到张三,怎么办呢?这时候你可以使用COM+的队列服务,把你打耳光的动作用Recorder录入COM+队列中,等张三回来了,队列服务中的Player才真正播放这个动作,把这记耳光赏给张三。例子比较粗俗,但想起张三那个倒霉样就想笑,科技发展那么快,说不准哪天就有这
有意思的成员变量 V1 最开始的时候,这样定义成员变量 class EmployeeV1 { public string Name; }V2 后来别人说,数据要隐藏,他们这样教我。于是每个成员变量都要配两个成员方法,就像两个保镖:一个用来给成员变量赋值;一个用来读取成员变量的值。 class EmployeeV2 { pr
盛饭的各种算法 开饭了,一家五口:爷爷、奶奶、爸爸、妈妈、儿子,先给谁盛饭呢,后给谁盛饭,先盛先吃,有这么几种算法可选择:1、 随机算法没有特定的顺序,谁都有可能第1个吃饭到,也有可能是最后1个。2、 轮转算法 今天你先盛,明天他先盛,轮流做老大。3、 先来先服务法谁先来,就给谁先盛。4、 后来先服务法按照来的顺序,最后来的先盛,最先来的最后盛。5、 最少资源占用时间法这里
擦皮鞋与软件开发 项目:擦皮鞋 下面分别用迭代方式和增量方式来擦皮鞋:一、迭代法(1)左右脚去浮土(2)左右脚擦鞋油(3)左右脚抛光 二、增量法(1)左脚去浮土,左脚擦鞋油,左脚抛光(2)右脚去浮土,右脚擦鞋油,右脚抛光
破解:已成功与服务器建立连接,但是在登录过程中发生错误。Microsoft SQL Server, Error: 233 在本机连接SQL Server 2005的时候出现的错误提示,完整信息如下:已成功与服务器建立连接,但是在登录过程中发生错误。 (provider: 共享内存提供程序, error: 0 - 管道的另一端上无任何进程。) (Microsoft SQL Server, Error: 233)如下图分析:根据提示内容,可排除网络连接、防火墙方面的问题。我所知道的只有一种原因:密
看大站怎么折腾之MySpace 大概MySpace是世界级大站中使用Microsoft DotNet平台的独苗,凭借Asp.Net和SQL Server竟然撑起来亿万用户,这一点估计Microsoft也没有想到吧!MySapce架构的变化大都发生在2004年和2005年早期,这期间用户数从几十万迅速攀升到几百万,在账户数超过700万后,架构相对稳定,下面看看MySpace在那两年间干了些什么?1、小于50万账户这期间
WebApp印象 1、定义Web Application是指通过使用Web和Web浏览器技术,跨越网络完成一个或多个任务的系统或应用,通常需要使用Web浏览器。属于RIA(Rich Internet Application)应用,目标是创建同时具有C/S和B/S优点的应用。2、4个条件HTML5、产业链、网络带宽和云计算在HTML5方面,技术不断成熟,开发框架不断发展;产业链方面,主流公司不
软件开发模型速记 1、瀑布 Waterfall瀑布最是简单明了,在所有软件开发模型中处于开山鼻祖的地位,天下武功出少林,用这话套在瀑布身上毫不为过。属于线性模型,直来直去,一捅到底,可实际开发中,哪有一根筋走直线的,君不见,越高的瀑布,落到底的时候溅起的水花也越大。2、快速应用开发 RAD瀑布模型的高速变种,想起一句台词:天下武功,为快不破,好像风马牛不相及:)3、演化 Evolutiona