- 博客(212)
- 资源 (17)
- 收藏
- 关注
原创 ucinet常用分析路径
1、将多值关系数据转换成二值关系数据,路径:变换→对分 2、密度分析,路径:网络→凝聚力→密度→密度 3、利用Net-Draw程序生成可视化结构图,路径:可视化→Net-Draw→Open→Ucinet Dataset→Network 4、中心性的可视化分析,路径:Analysis→Centrality Measures 5、节点中心度分析,路径:网络→中心度→
2015-06-16 17:46:35 19396 8
原创 社会网络分析法SNA
社会网络分析法 社会网络是社会行动者及他们之间关系的集合,行动者可以是个人、群体、组织乃至国家。关系是多方面的,有多种类型。由来自一个群体内行动者之间的关系构成的网络叫做1-模网络;两个群体的行动者之间的关系网叫做2-模网络;一个群体内的行动者参与多个社会团体构成的网络叫做隶属关系网。 由于关系数据不满足常规统计学意义上的“变量的独立性假设”,因此,通常意义上的各种多元
2015-06-16 11:19:59 14065 1
转载 9个优秀的标签云免费生成工具
标签云或文字云是关键词的视觉化描述,用于汇总用户生成的标签或一个网站的文字内容。标签一般是独立的词汇,常常按字母顺序排列,其重要程度又能通过改变字体大小或颜色来表现,所以标签云可以灵活地依照字序或热门程度来检索一个标签。 大多数标签本身就是超级链接,直接指向与标签相联的一系列条目。WordleWordle是产生“词云:。不同的字体,布局和配色方案,你可以调整你的云。。您可以打印出来,或
2015-06-15 17:47:04 4673
转载 10款神奇的字符图案 & 词汇云生成工具
ImageChef写一个评论或诗,并以心的形状或其他符号显示。送一个祝福或发布到 Facebook 或你的博客。 WordItOut随机排布文字,创造出有吸引力的定位效果,最重要的文字,字号越大。 VocabGrabberVocabGrabber 分析你感兴趣的任何文本,生成列表的最有用的词汇并向你展示如何在上下文使用这些词语。 Wordle你可
2015-06-15 17:41:13 5808
转载 AHP-层次分析法(C++源码,附详细注释和样例)
算法简介AHP-层次分析法是数学建模中的常用算法,其适用于一批非常广泛的问题,综合来说,它是一个“层次权重决策分析方法”。客观地讲,它适用于一些有限制条件的决策选择问题:1. 决策有限,且只从有限的候选决策里选择。2. 决策的影响因素已知,因素的关系(包括隶属关系和优先级关系)已知3. 因素的关系不论客观与否,要通过合理性校验,即必须是合理的关系才
2015-06-12 14:07:41 8634 4
原创 层次分析法
层次分析法(Analytic Hierarchy Process,简称AHP)是将与决策总是有关的元素分解成目标、准则、方案等层次,在此基础之上进行定性和定量分析的决策方法。该方法是美国运筹学家匹茨堡大学教授萨蒂于20世纪70年代初,在为美国国防部研究"根据各个工业部门对国家福利的贡献大小而进行电力分配"课题时,应用网络系统理论和多目标综合评价方法,提出的一种层次权重决策分析方法。 应用实
2015-06-11 18:11:53 24337
原创 2014 阿里巴巴 数据分析师 笔试
考试内容涉及:概率统计、数据挖掘、SQL语句、开放性分析题题型包括选择题(10*3)、问答题(3*10)、分析题(2*20)一、选择题(1)相关系数r=0的意义(2)求小球的概率(3)小松鼠搬运松果(一般性计算题)(4)给出几个名词,问哪一个属于聚类算法,选项中包括决策树、逻辑回归、神经网络、k-means(5)逻辑回归算法的概念(6
2015-06-10 16:13:43 1373
转载 数据分析师成长之路-软件篇
数据分析师成长之路-软件篇 对于各式各样的数据统计分析软件,你了解多少呢?经过潜心搜集,整理,这里总结了一些软件的大体介绍及区别,欢迎大家指正和补充。这里先略过Excel和Eviews这种入门软件的介绍,直接从SPSS开始吧!SPSS:傻瓜相机SPSS(Statistical Product and Service Solutions),“统计产品与服务解决
2015-06-10 16:02:46 1945
转载 数据分析师面试题攻略
计算平均有哪些指标,各有哪些优缺点数值平均数有算术平均数、调和平均数、几何平均数等形式 位置平均数有众数、中位数、四分位数等形式 前三种是根据各单位标志值计算的,故称为数值平均值,后三种是根据标志值所处的. 相关分析和回归分析有什么关系 回归分析与相关分析的联系:研究在专业上有一定联系的两个变量之间是否存在直线关系以及如何求得直线回归方程等问题,需进行直线相关和回归分析。从研究的
2015-06-10 15:55:25 2398
原创 CPDA项目数据分析师和CDA数据分析师有什么区别?
CPDA项目数据分析师和CDA数据分析师有什么区别?这个问题也是经常问到的,这里我做一个详细的区分。关于CPDA,CPDA全名叫项目数据分析师,在国内做培训比较早,课程内容主要针对的是基于传统企业在投资管理领域的项目分析,类似MBA,以数据支持来进行业务层面的管理和分析,课程包括《量化投资》等知识内容,应该说投资类企业的管理层适合学习CPDA来进行管理层面的分析和指导。关于CDA,CDA全
2015-06-10 13:39:07 2437
转载 中国大数据人才薪酬报告
2015年3月,白宫经任命DJ Patil作为全国第一个首席数据科学家。这位前PayPal和eBay的执行官,来到白宫之后有了新的任务:帮助美国政府最大限度的进行他们对大数据的投资,并围绕政府机构如何更好使用大数据给出建议。 美国政府正在用实际行动告诉大家,政府的工作已经不再是你印象中的那样了。过去的政府里,计算机还只是一个简单的办公工具,甚至被简单的当成笔和纸的替代品。但是今天
2015-05-28 15:31:17 3321 1
原创 Do You Know ETL ?
ETL是数据的提取、转换和加载;ETL是指获取原始大数据流,然后对其进行解析,并产生可用输出数据集的过程。从数据源中提取(E)数据,然后经过各种聚合、函数、组合的转换(T),使其变为可用数据。最终数据会被加载(L)到对它进行具体分析的环境中。这就是ETL流程。MapReduce是一种并行的编程架构,它不是数据库,而是对现有技术的补充。MapReduce里内置了两个主要的处理过程
2015-05-20 09:45:11 640
原创 数据挖掘十大经典算法
国际权威的学术组织the IEEE International Conference on Data Mining (ICDM) 2006年12月评选出了数据挖掘领域的十大经典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Naive Bayes, and CART. 不仅仅是选中的十大算法,其实参加评选的18种算法
2015-05-18 16:59:01 825
原创 深入理解SQL的四种连接-左外连接、右外连接、内连接、全连接
本篇文章是深度解析了SQL中的四种连接-左外连接、右外连接、内连接、全连接,进行了详细的分析介绍。
2015-05-17 15:58:21 1947
原创 Mysql与cmd不得不说的秘密
1、从cmd中进入MySQL的命令界面1.开始中找出运行:输入cmd2.查找appserv所在盘,我的在D盘,所以接着输入:d:3.在d盘中查找mysql所在目录:cd appserv\mysql\bin4.再输入主机名、数据库名、密码:mysql -h localhost -u root -p5.最后输入数据库密码2、 忘记MySQL的密码怎么
2015-05-17 14:25:51 1151
转载 数据挖掘的方法有哪些?
利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web页挖掘等,它们分别从不同的角度对数据进行挖掘。1、分类分类是找出数据库中一组数据对象的共同特点并按照分类模式将其划分为不同的类,其目的是通过分类模型,将数据库中的数据项映射到某个给定的类别。它可以应用到客户的分类、客户的属性和特征分析、客户满意度分析、客户的购买趋势预测等,如一个汽车
2015-05-17 11:46:34 1267
转载 Tableau Desktop介绍
Tableau Desktop——为您在数据分析中的问题提供最佳解决方案 Tableau Desktop,基于斯坦福大学在数据分析领域中的突破性研究成果,利用令人耳目一新的拖拽(drag & drop)的方式来分析数据。点击相关数据,它就可以快速创建一个可视化和交互式的分析视图。 在这方面,我们努力了数年,研究出一个支持人们利用天生的“见图知意”能力的数据分析系统。Tab
2015-05-13 12:00:42 3075
转载 数据挖掘150道试题 学会你也具有专业能力
一、 单选题1. 某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?(A)A. 关联规则发现B. 聚类C. 分类D. 自然语言处理2. 以下两种描述分别对应哪两种对分类算法的评价标准? (A)(a)警察抓小偷,描述警察抓的人中有多少个是小偷的标准。(b)描述有多少
2015-05-12 18:07:29 4155
转载 CDA数据分析师认证考试模拟题库
CDA等级考试模拟题库Level 11、分析教师和会计师之间收入的差异,选择什么分析方法最合适?A、卡方分析B、方差分析C、两样本T检验D、相关系数答案C 2、分析购买不同产品的频次时,使用以下哪个任务?A、列表数据B、汇总表C、汇总统计量D、单因子频数答案D 2、分析购买不同产品的频次时,使用以下哪个任务?
2015-05-12 11:46:49 96782
原创 CDA数据分析师协会等级认证证书
CDA数据分析师协会等级认证证书(Certified Data Analyst Certificate)CDA数据分析师证书由CDA数据分析师协会官方颁发,此证书在国内需通过人大经济论坛举办的CDA等级认证考试后获得。此证书可作为企业事业单位选拔和聘用专业人才的任职参考依据。 一、考试简介: CDA(Certified Data Analyst),全称“注册数据分
2015-05-11 11:17:13 6403
原创 解读数据分析是神马?
1、什么是数据分析/挖掘数据分析/挖掘的目的是为业务发展答疑解惑。他描述了“过去发生了什么”、“现在正在发生什么”和“未来可能发生什么”。根据分析的级别,分为常规报表、即席查询、多维分析(又称为钻取或者OLAP)、报警、统计分析、预报(或者时间序列预测)、预测性(predictive)模型和优化常规报表:常规报表广为人知,它们通常按照一定的周期产生,对过去一段时间、一定
2015-05-11 10:49:52 1610
转载 NLP中的中文分词技术
随 着需求的变化和技术的发展,互联网企业对数据的分析越来越深入,尤其是自然语言处理处理领域,近几年,在搜索引擎、数据挖掘、推荐系统等应用方面,都向前 迈出了坚实的步伐。自然语言处理领域涉及的技术非常多,为了让对此领域感兴趣的同学能够快速入门,在这里介绍一下中文信息处理的基本技术:中文分词。说分词是中文处理的基本技术,是由汉语的特点决定的。汉语的有些单字没有意义,多字合起来才有意义,
2015-04-29 17:59:14 1644
原创 如何成为顶尖的数据分析师
什么是数据分析?数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总、理解并消化,以求最大化地开发数据的功能,发挥数据的作用。数据分析的目的是把隐藏在一大批看似杂乱无章的数据背后的信息集中和提炼出来,总结出研究对象的内在规律。在实际 工作当中,数据分析能够帮助管理者进行判断和决策,以便采取适当策略与行动。数据分析师指的是不同行业中,专门从事行业数据搜集
2015-04-27 16:53:09 1957
转载 10、spss做最优尺度分析
上一节我们讨论了对于两组分类变量,如何通过主成分分析法进行降维,从而在一个二维的平面上直观的表现出两组变量的类别之间有什么关联。这一节我们就来讨论要怎么通过最优尺度分析来解决多组分类变量之间的关联分析。我们首先选择菜单分析——降维——最优尺度,打开最优尺度面板,我们看到,这是个很小的面板。首先最佳度量水平里有两个选项,所有变量均为多重标称,或某些变量并非多重标称。那
2015-04-15 15:37:52 10888 3
转载 9、spss做交叉表检验和对应分析
前边我们已经讲过很多内容了。回顾一下,主要有相关分析,假设检验,和各种回归。以及因子分析。我们知道,对于两组连续变量,我们可以通过假设检验来判断他们的分布是否相同,差异时候存在。不知道大家想过没有,如果我们想讨论两个分类变量的分布是否相同呢?这里我们首先来讨论这个问题。首先举个例子,假设我们有两个不同季节的某种卫生的是否达标的记录。那么我们就是有两组二分类的变量(就是取值不是这个就是那个,
2015-04-15 15:35:34 10340
转载 8、spss做因子分析及主成分分析
上一篇文章我们讨论完了回归的最后一部分内容,非线性回归。这一次我们正式结束回归,开始讨论降维分析。在之前关于相关的内容里,我们就说过,做相关,回归等分析的时候,消除多重共线性是一个很复杂很复杂的问题,一次数据分析的变量多达三四十个是很正常的情况,这个时候调整变量的效果往往微乎其微,因此就需要用到一个有力办法,降维。现在我们就来谈一谈降维。首先要先明确一个概念,什么是降维。我们知道“维”是一
2015-04-15 15:34:21 14890 5
转载 7、spss做probit回归和非线性回归
Probit回归:Probit回归全称probability unit,翻译过来叫做概率单位法,蛮拗口的一个名字。这个回归主要用于研究半数效量用的。直白一点说,就是比方你拿一种药去药蟑螂,你想知道你用多少药能药死多少蟑螂,那你就可以用probit回归来估计这个数。Probit回归经常拿来和logistic回归作比较,通常对于二分类变量来说,这两个回归计算出来的概率是非常相似的。(虽然log
2015-04-15 15:32:58 5885 1
转载 6、spss做logistic回归
前边我们用两篇笔记讨论了线性回归的内容。线性回归是很重要的一种回归方法,但是线性回归只适用于因变量为连续型变量的情况,那如果因变量为分类变量呢?比方说我们想预测某个病人会不会痊愈,顾客会不会购买产品,等等,这时候我们就要用到logistic回归分析了。Logistic回归主要分为三类,一种是因变量为二分类得logistic回归,这种回归叫做二项logistic回归,一种是因变量为无序多分类
2015-04-15 15:29:38 6234
转载 5、spss做加权最小二乘回归及岭回归
上一节我们讲到一般多元线性回归的操作方法。本节要介绍的是多元线性回归的其他几种情况。包括适用于含有加权变量的加权最小二乘回归方程等。然后继续讨论上一节中没有讨论完毕的如何解决多重共线性这个问题。讲加权最小二乘回归之前,我们首先还是举个例子。假设我们想考察全国三十一个省的某种疾病的发病率和每个省的面积,平均气温等的关系,那么我们知道,这三十一个省的人口肯定是不同的。而且差距还蛮大。并且最重要
2015-04-15 15:23:34 7439
转载 4、spss做多元线性回归
回归一直是个很重要的主题。因为在数据分析的领域里边,模型重要的也是主要的作用包括两个方面,一是发现,一是预测。而很多时候我们就要通过回归来进行预测。关于回归的知识点也许不一定比参数检验,非参数检验多,但是复杂度却绝对在其上。回归主要包括线性回归,非线性回归以及分类回归。本文主要讨论多元线性回归(包括一般多元回归,含有虚拟变量的多元回归,以及一点广义差分的知识)。请大家不要觉得本人偷奸耍滑,居然只有
2015-04-15 15:19:34 7615 1
转载 3、SPSS做非参数检验
非参数检验是一个相当宏大的命题。由于实际情况的复杂多变,因此非参数检验包括了许多的各种各样的检验方法。之前我们提过,参数检验的使用条件是被检验的样本总体服从正态分布,而非参数检验的使用条件自然就是总体不服从或不确定是否服从正态分布。(实际上,这里要特别说明一下,尽管非参数检验的使用条件更宽松,但是考虑到精确性,不是特殊要求的话,我们还是尽可能的使用均值检验。)比较常见的单样本非参数检验包括
2015-04-15 15:16:32 5709
转载 2、spss做均值比较分析
上一篇文章我们分享了如何用spss做相关性分析,主要包括双变量相关分析,偏相关分析,以及比较偏门的距离相关分析。其中双变量相关分析又包括三种不同的分析方法。如果忘了的可以回去看一下哈。这次我们来一起学习另一个比较基础的分析方法,均值比较分析。均值比较分析也是一种基础的分析手段,我们通过基础方法来看出数据中隐含的规律。只有明确了这些规律,在后边的高级分析中才能起到事半功倍的效果。因此,我们首
2015-04-15 15:13:49 7579 1
转载 1、spss中做相关分析
相关分析是很基础的一种分析方法,接触spss的同学很快就会学习到想相关分析。虽然他很基础,但是在做很多高级分析之前,都要进行相关分析。这篇问文章就系统的和大家分享一下spss里如何做相关分析。 在spss中相关分析主要分为三大类,分别是双变量相关分析,偏相关分析和距离相关分析。 1、双变量相关分析主要研究两个变量数量之间的相关性。它又分为pearson相关分析,ke
2015-04-15 14:17:35 6343
转载 生活小常识:增发防脱发
注意改善营养状态。有利于头发生长的食品 ,蛋白质:牛奶 肉类 鱼类 ;维生素AD:菜花 菠菜 胡萝卜 ;矿物质:海白菜 海带 ; 1.补充铁质。经常脱发的人体内常缺铁。铁质丰富的食物有黄豆、黑豆、蛋类、带鱼、虾、熟花生、菠菜、鲤鱼、香蕉、胡萝卜、马铃薯等。 2.补充植物蛋白。头发干枯,发梢裂开,可以多吃大豆、黑芝麻、玉米等食品。 3.多吃
2015-04-09 22:13:14 2036
转载 SPSS聚类分析——一个案例演示聚类分析全过程
SPSS聚类分析——一个案例演示聚类分析全过程摘要: 案例数据源: 有20种12盎司啤酒成分和价格的数据,变量包括啤酒名称、热量、钠含量、酒精含量、价格。数据来自《SPSS for Windows 统计分析》案例数据源:有20种12盎司啤酒成分和价格的数据,变量包括啤酒名称、热量、钠含量、酒精含量、
2015-03-06 14:46:23 22044 2
转载 水晶易表 Xcelsius 2008 安装指南 完美支持office2010
Xcelsius2008水晶易表是一款非常好用的软件。网上已经有破解方法,大家可以尝试一下这款经典软件了。但是网上对于安装破解过程介绍的不具体或者纷乱,今天我汇总了所有的方法终于成功的安装上了,并且支持office2010.(默认只支持到office2007)下面具体说下安装过程及注意事项。1.在sap官方网站下载Xcelsius2008 30天试用版。Xcelsius_E
2015-01-15 16:15:36 2580 1
转载 EXCEL图表工具箱—JWalk Chart Tools
1、初次见面 第一次和JWalk Chart Tools见面是在学习“小蚊子前辈”的《谁说菜鸟不会数据分析》的时候。当时JWalk Chart Tools 还仅仅只有“Excel文本标签添加神器”一个称号。2、尴尬的重逢 7月25日,群里学习《谁说菜鸟不会数据分析》的MM求助:使用JWalk Chart Tools加载宏后如何使数据标志的格式变为百分比? 偶当时不假思
2015-01-11 23:00:01 3203
转载 一位资深数据分析师的分享
一位资深数据分析师的分享发表于 2012-05-08 01:10 来源:中国统计网一、掌握基础、更新知识。 基本技术怎么强调都不过分。这里的术更多是(计算机、统计知识), 多年做数据分析、数据挖掘的经历来看、以及业界朋友的交流来看,这点大家深有感触的。 数据库查询—SQL数据分析师在计算机的层面的技能要求较低,主要是会SQL,因为这里解决一个
2015-01-05 18:02:59 1104
转载 如何用SPSS和Clementine处理缺失值、离群值、极值
一、什么是预处理、预分析?高质量数据是数据分析的前提和分析结论可靠性的保障。尽管在获取数据源时数据分析师格外谨慎,耗费大量的时间,但数据质量仍然需持续关注。不管是一手还是二手数据源,总是会存在一些质量问题。同时,为了满足数据分析、挖掘的实际需要,对噪声数据如何处理,是丢弃还是补充,或者重新计算新的数据变量,这些不是随意决定的,这就是数据预处理的一个过程,是在数据分析、挖掘开始前对数据源的审
2015-01-05 17:54:56 8153
《良心作品,绝对免费》利用Python进行数据分析(第二版)高清中文版英文版和源代码
2019-04-17
Tableau图表实战演练
2015-05-25
深入浅出统计学
2015-04-23
SPSS统计分析与数据挖掘(最新完整版)谢龙汉
2015-04-17
大嘴巴漫谈数据挖掘(完整版)
2015-03-10
RacerPro-2-0-Users-Guide-2-0-Preview.pdf
2013-12-01
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人