第一章 统计学导论
概要:统计学含义、发展历史、应用
前言
“统”,既指整体,也指归纳综合;“计”,既是分析,亦是计算计量。统计就是有目的地对特定现象或事物在特定时间、空间条件下的特征用数据加以记录与分析的活动。
统计学则是指导统计活动的科学,也就是要为如何获取数据、表现数据和分析数据提供理论方法。
一、统计学是什么?
定量认识 是人类认识世界、认识社会的重要途径之一,是通过数据来说明问题,通过定量分析来揭示事物本质。
那么,什么是数据?数据从何而来、如何构成?它们分别具有什么特征、说明什么问题、隐含怎样的关系和规律?如何去获取需要的数据、如何利用数据得出所需的结论?这些问题的回答就属于统计学的核心任务了。
统计学是收集和分析数据的科学,其本质决定了其研究对象为客观现象数据 ,即各种客观现象的数量方面,具体表现为数量大小、关系、变动、界限、规律,分别从不同角度表明现象的特征。统计研究 就是要通过定量研究和统计数据来体现研究现象的数量特征,进而认识现象的本质和规律。体现现象数量特征的方式是设计各种统计变量、统计指标与体系。
数据分析的方法可分为描述统计方法 和推断统计方法。前者研究的是数据收集、汇总分类计算、以图表和综合指标加以显示的方法;而后者是根据样本数据对总体数量特征做出估计和假设检验的方法。
综上,统计学是关于如何给予现象本质去收集和分析数据的方法论科学。
二、产生与发展
时期 | 统计发展 |
---|---|
原始社会 | 结绳、串珠、刻线等计数活动; |
奴隶社会 | 因对内统治和对外战争的需求,开始了对人口、土地和财产的统计; |
封建社会 | 统计范围有所扩大,统计方法仍不完善; |
资本主义社会 | 随着生产力的发展和社会分工的细化,统计从政府治理领域逐步扩展到了工业、农业、贸易、银行、保险、交通、等经济领域以及科技、环境和社会领域;并且出现了专业统计机构和组织,统计方法迅速发展和完善; |
二战后 | 电子计算技术的推广应用,统计算力都大幅度提升; |
大数据时代 | 海量数据的出现,为统计的发展提供了原料; |
1.古典统计学(17世纪中期~18世纪末期)
统计学起源于两大学派:德国国势学派和英国政治算术学派。国势学派所确立的研究对象是国家显著事项,主要是通过对国家组织、人口、军队、领土、居民职业、资源财产等事项的记录来分析和研究国情国力。但国势学派在进行国势比较分析中片中事物性质的解释而非数量分析,非“现代统计学之实”。
政治算术学派则是以数字、重量和尺度来研究社会经济现象及其相互关系。威廉·配第在《政治算术》中提出,不用比较级、最高级进行思辨或议论,而是用数字来表达自己想说的问题,借以考察在自然中可见根据的原因。并在该书中用数量分析的方法对比了英法荷三国的财富与力量,提出了用图表概括数字资料的理论和方法,运用了分组和推算等方法。约翰·葛朗特在其著作《关于死亡表的自然和政治观察》中首次利用大量数据研究人口变动规律分析和总人口推算方法,编制了初具规模的“生命表”,大量运用了观察法、分类分析法、对比分析法综合研究社会经济问题。
2.近代统计学(18世纪末~19世纪末)
这一时期的标志性成就是大数法则和概率论的引入,最小平方法、误差理论和正态分布理论也成为了统计学的重要内容。这一时期的发展主要贡献来源于数理统计学派和社会统计学派。数理统计学派代表人物凯特莱著有《概率论书简》《社会物理学》等,主张用自科方法研究社会现象,正式把概率论引入统计学,应用大数定律论证了社会生活中随机现象的规律性,提出了“平均人”的思想。数理统计学派侧重于对一般通用方法的研究。
社会统计学派首创人物克尼斯认为,统计学是研究社会现象变动原因和规律的实质性科学,通过对总体的大量观察和分析研究其内在联系来揭示社会现象的规律。促进了社会经济统计指标的设定与计算、指数编制、统计调查的组织与实施、经济社会发展评价与预测的发展。如恩格尔系数、国民收入和国内生产总值核算方法、拉氏和派氏综合物价指数等。社会统计学派侧重强调实质性,即对现象本质规律的认识和研究。
3.现代统计学(19世纪末至今)
数理统计学由于广泛同自科、工科结合以及广泛应用于各个领域而获得了迅猛发展。各种新的统计理论和方法,特别是推断统计理论和方法,如卡方分布理论、小样本t分布理论、F分布理论、置信区间估计理论和假设检验理论、非参数统计法、序贯抽样法、多元统计分析法、时间序列跟踪预测法逐步成为现代统计学的主要内容。 与此同时,里昂惕夫提出了投入产出分析方法,国民核算方法也取得了创新和发展。
随着天文学、气象学和生物基因学等复杂系统研究数据增加,数据挖掘分析法应运而生,借助计算机技术不断增强。
电子信息技术和互联网、物联网的发展应用,多学科交叉融合的大数据分析方法将是统计学目前发展的主要方向。
统计发展的三大要素:算法、算力、数据
总结
人类在认识自然、认识社会的过程中离不开各种各样的数据,否则就失去了客观标准,需要统计数据以及以此为基础分析并加以说明。生产活动中最优生产方案和质量控制设计需要我们对影响因素进行观察和实验,去了解各种因素对质量和产量的影响方式和程度,从而找到各因素的最佳水平和组合。社会经济管理宏观政府层面上需要运用统计方法,去检测和预警国民经济和社会发展状况,对各种社会经济问题进行定量模拟和分析,从而为制定和调整政策提供依据;微观企业层面需要应用统计方法,去及时收集市场信息、反映企业生产经营状况,预测和判断市场趋势。科学研究的方法是通过观察或实验来提出假设和猜想,再根据实验或观察来验证假设的循环过程,其结果也往往表现为数据,显然离不开统计理论和方法的应用。