关于数据建模、可视化的“傻瓜软件”

谈到统计,有两种看法很多。其一,数数的,比如指标计算、报表统计这些,好像不需要专业人士,会点execl的就能做;其二,大数据,写代码搞计算机的,但实际上它跟IT的区别也不小。

这两种看法都比较极端,但主流的确如此,市场上提供的要不是极low的“数据文职”,要不是招聘要求天花乱坠的全能岗位,跟普通人比被质疑专业度,跟IT比代码能力又差了点,两头不落好。

但也别妄自菲薄,统计的价值是一直存在且独一无二的。在一家数据量比较可观的公司,传统的分析维度显然不足以充分发挥数据的价值,在这里,统计人可以:跳出浅显的框架进一步挖掘数据的信息(方法理论和实现技术都必须掌握);通过报告、可视化实现结果简明、精确的呈现(BI应用、规范化报告都得熟);完成数据批处理自动化(对于规律化流程,编程一定帮得上大忙)。

区分开基础的数据工作从业者,咱们现在再跟IT的大兄弟们比比。下面是一个流传很广的数据科学韦恩图,如果说大部分统计人在单独的绿色部分,那绝大多数的IT人就在单独的红色部分,而招聘文案上满足的只是最中间交叉的那一小撮,无一不通的“独角兽”真的存在吗?也许有,但凤毛麟角。明白这点就该知道,IT与统计,更应该是协作,而不是取缔。
在这里插入图片描述
统计人的代码能力重要吗?当然重要。但一定不是为了比IT人士更强,而是为了更好地完成我们自己的事情,以及在协作的过程中了解对方的业务,以充分发挥两者的优势。

后面几篇文章将依次介绍几个在数据分析上“傻瓜软件”:modeler、SPSS、tableau,涉及一些实用统计模型:详情

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
DataUml Design 是面向开发人员使用的一个永久免费的软件,提高软件的开发效率和代码的规范度。它主要包括三大功能,数据模型、代码生成和UML建模,数据模型功能类似于PowerDesigner软件,代码生成类似于动软的代码生成器. DataUml Design是采用WPF开发的一款软件,该软件功能包括实体类建模、数据库设计、模型与数据库同步、数据库与模型同步、代码生成、文档生成、数据库生成实体模型等功能。以往的软件修改模型之后还得修改数据表结构,需要同步修改两个地方,而DataUml Design解决了该问题, 软件开发人员只需要修改模型结构或数据表结构,然后利用软件的同步功能即可达到模型与数据表结构的一致性。方便开发人员轻轻松松地管理自己的模型与数据库。 DataUml Design的自定义模板采用微软的4T技术,开发人员可以配置自己的代码模板。如实体层、数据访问层和UI层都可以用模板来配置,由模型一键生成代码,实现模型与代码的一致性。 DataUml Design支持数据的导入与导出,可以导出模型结构的文档,也支持其实数据导入生成数据模型(下一版本将实现)。 DataUml Design目前只支持MS Server和Oracle数据库、C#和Java语言,其它数据库和语言下一版本将实现。 DataUml Design功能特点 1)、模型设计 DataUml Desing数据建模采 用图形化设计,基于UML标准,遵循UML类图概念。模型中的类和数据库中的表对应,类的成员分为字段、属性、事件等,类的属性对应数据表中的字段。类的 属性成员的属性又包括数据表中字段的所有属性。类与类的关联关系包括单向关联、双向关联、组合、聚合。关联关系与数据表中的外键相对应。关联关系也具有属 性。 2)、模型和数据库同步 数据模型与数据库绑定,设计模型之后可以一键把模型提交到绑定的数据库中,如果数据库中表存在,则会更新数据表结构,如果数据库中代不存在,则会创建一张新表,用户不需要关心如何数据库类型,DataUml Design会帮你完成所有功能。 如果数据表中增加了字段或修改了某个字段,需模型中需没有更改,只需把数据表同步到模型即可,不需要开发人员对照数据表结构来修改模型结构。 3)、代码生成 DataUml Desing采用代码模板来生成代码,软件开发人员可以根据自己的要求来设计代码模板。代码模板可以生成任务语言的代码。软件开发人员可以用代码模板获取到类的所有属性以及关联的类。 软件下载地址: www.netuml.com
DataUml Design 是面向开发人员使用的一个永久免费的软件,提高软件的开发效率和代码的规范度。它主要包括三大功能,数据模型、代码生成和UML建模,数据模型功能类似于PowerDesigner软件,代码生成类似于动软的代码生成器. DataUml Design是采用WPF开发的一款软件,该软件功能包括实体类建模、数据库设计、模型与数据库同步、数据库与模型同步、代码生成、文档生成、数据库生成实体模型等功能。以往的软件修改模型之后还得修改数据表结构,需要同步修改两个地方,而DataUml Design解决了该问题, 软件开发人员只需要修改模型结构或数据表结构,然后利用软件的同步功能即可达到模型与数据表结构的一致性。方便开发人员轻轻松松地管理自己的模型与数据库。 DataUml Design的自定义模板采用微软的4T技术,开发人员可以配置自己的代码模板。如实体层、数据访问层和UI层都可以用模板来配置,由模型一键生成代码,实现模型与代码的一致性。 DataUml Design支持数据的导入与导出,可以导出模型结构的文档,也支持其实数据导入生成数据模型(下一版本将实现)。 DataUml Design目前只支持MS Server和Oracle数据库、C#和Java语言,其它数据库和语言下一版本将实现。 DataUml Design功能特点 1)、模型设计 DataUml Desing数据建模采 用图形化设计,基于UML标准,遵循UML类图概念。模型中的类和数据库中的表对应,类的成员分为字段、属性、事件等,类的属性对应数据表中的字段。类的 属性成员的属性又包括数据表中字段的所有属性。类与类的关联关系包括单向关联、双向关联、组合、聚合。关联关系与数据表中的外键相对应。关联关系也具有属 性。 2)、模型和数据库同步 数据模型与数据库绑定,设计模型之后可以一键把模型提交到绑定的数据库中,如果数据库中表存在,则会更新数据表结构,如果数据库中代不存在,则会创建一张新表,用户不需要关心如何数据库类型,DataUml Design会帮你完成所有功能。 如果数据表中增加了字段或修改了某个字段,需模型中需没有更改,只需把数据表同步到模型即可,不需要开发人员对照数据表结构来修改模型结构。 3)、代码生成 DataUml Desing采用代码模板来生成代码,软件开发人员可以根据自己的要求来设计代码模板。代码模板可以生成任务语言的代码。软件开发人员可以用代码模板获取到类的所有属性以及关联的类。
DataShow是一款基于.net Framework2.0的Microsoft SQL Server数据库建模工具,工具全部采用C#代码完成。该工具旨在利用自定义表字典的功能来设计强大的数据库控件或者页面,减少开发周期和代码量。 本工具具有如下特点: 1、支持自定义表的种类,将创建的表予以分类。 在创建种类时您可以为种类设置此种表的模板列,在创建该种类的表时,工具会提示您载入模板列,这种设计可以减少同类表多次创建时的工作量。 2、种类包含一个前缀,有利于数据库表的命名规范。 3、创建/编辑表定义时,您可以拷贝、粘贴多个列以减少创建表时的工作量。 4、每个列都包含编辑格式、列宽、显示格式等多种自定义属性,在设计控件时,您可以根据这些属性为不同的字段设计不同的编辑控件。 当然除了以上列举的属性外,还有部分未被设计进本工具的属性,如验证属性、查询属性等。关于这方面的应用请参考本工具的预览功能。 5、编辑格式及预览功能支持您自行扩展的用户控件以进行更高级的设计。 您可以创建一个项目,添加对DataShow.Interfaces.dll的引用,并实现其中的接口,将编译好的DLL添加到[选项]->[插件]的列表中即可在编辑格式或预览时看到您自定义的用户控件。 6、支持对数据库关系的维护。 在创建/编辑表定义时,您都可以打开关系设计界面对关系进行维护。 7、递归式的数据库修改。 当您更改某个受关系影响的列的数据类型、长度、精度、小数位数等信息时,关系中的其他字段将随之更改,这个过程是递归的,所有与该字段有直接或间接关系引用的字段都将受到更改。 8、为更改生成SQL脚本。 使用生成SQL脚本的功能,您可以像使用企业管理器一样为任意修改生成SQL脚本,通过工具内置的SQL执行工具,您可以将更改应用于多台开发机上以保持数据库的一致。 9、与自定义控件结合,使您在做表定义时即时预览到自定义控件的绑定效果。 10、内置有SQL执行工具,该工具是一款简单的查询分析器,目的旨在将您对数据库所做的更改快速布置到其他开发机上。 复杂的SQL语句建议您使用查询分析器完成。 11、表字典生成器让您快速地将本工具使用溶入开发中。 可能您的项目已经着手开发一段时间了,即使是这样,您依然可以让本工具为您效劳。您只需打开表字典生成工具,工具会读取数据库中所有的表及字段信息,根据您的配置生成字典。 12、数据库设计文档生成功能。 文档生成工具将根据您的表定义和字段定义读取字典表中的信息并将这些信息按照您定义的方式生成数据库设计文档。生成方式采用写流方式生成,生成速度快,免去您编写数据库文档的麻烦。 13、备份、还原、收缩数据库功能。 14、表数据预览及编辑功能。 您可以在选项中关闭修改显示的表数据的功能。 15、工具包括多项人性化选项。 16、表定义说明:表工具使用初期,工具会检查您数据库中的是否已经存在Dic_Columns、Dic_Datatypes、Dic_Relation、Dic_RelationDetail、Dic_Sequence、Dic_Tables、Dic_TableTemplate以及Dic_TableType,如果您的数据库中不存在这些表,工具会自行创建。 Dic_Columns:存储字段信息,各个字段的说明请查看表字义。 Dic_Datatypes:存储数据类型信息。 Dic_Relation:存储表关系,各个字段的说明请查看表字义。 Dic_RelationDetail:存储表关系的字段关联信息,各个字段的说明请查看表字义。 Dic_Sequence:用于生成序列号,一般是用于生成主键编号,请勿修改这个表的数据。 Dic_Tables:存储表的字典信息。 Dic_TableTemplate:存储种类的字段模板,各个字段的说明请查看表字义。 Dic_TableType:存储种类信息。 关于作者: 作者:陈鹏伟 联系方式:QQ 89202269 手机:13788892380。 此工具是本人利用业余时间编写数月的成果,转载请保留作者信息。 由于水平有限且没有专门的测试人员做测试= =!BUG在所难免,如果您有任何意见或建议,或者希望索取源码,欢迎与本人联系。 特别鸣谢:张希禄 我的启蒙老师,这个工具的设计来自他关于DataShow的思路。 希望本工具能为您的开发带来方便!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值