统计学的入世与出世观----谢邦昌

  “要学会如何 Google ,如何百度”
                                                       ----------------谢邦昌(辅仁大学统计学教授,中华资料协会理事长)
  装饰了这么漂亮的题目,可能只是这一、二年来自己心中的牢骚,或许也可将之视为统计人的心灵改革。促成此题目最大的动机是希望能提振统计的风气,因为无论是院处、省府或县市,有许多同仁私下与我聊天时皆认为现下统计的气氛日益低迷,甚至在学校也经常面临学生的质疑,他们怀疑统计的价值,对统计在社会中扮演的角色与发挥的功能无法产生认同感。相信一些和我一样从事统计研究的先进在看待这些问题时也有相同的看法,希望能够有认同我们的人并且在这共识间共同持续地努力。

  任何领域最重要的就是每一个参与的人对此领域的关心,我经常讲一句很臭屁的话:「whenyou analyse any topic, you are involved instatistics.」,自从在很多场合发表过这句话后,至少还没有人认为我在”澎风”。事实上亦是如此,在许多领域中会发觉需要统计,统计在许多领域中皆扮演举足轻重的角色。当然并非没有统计就无法运作,但有了统计加入,可以做出更好、更精致的决策。因此统计是无所不在的。我本身所学为生物统计,当初一进农学院,老师就告诉我们一句话:「whenyou eat, you are involved inagriculture.」,你只要想到吃,你就在所有农业范围里。相对的,只要想到任何领域中的任何分析、任何主题,就应该involved到统计的领域里面。因此今天并非统计没落,而是因为大家都懂统计,很多人都认为他会统计,这时统计的专业人员应抱持什么态度呢?绝不是人人都懂统计,就觉得统计不重要,相反的应该更重视统计,认定统计日益重要。这是我最初步的观点。

  在此引用韦主计长的一些论点,主计长曾有一篇「从管子问篇论整个国政」,他所写的社会指标第一章的指标管理就提到从古到今统计对国政的重要性,汉、唐之兴盛奠基于秦、隋两朝代健全的统计制度,若没有秦跟隋健全的统计制度,汉唐盛世无法延续如此之久,所以基本上从历史的角度来看统计的重要是有其道理的。另外先提一下统计的本质—机率性,好比我想去一个地方,不巧碰上塞车,在路上我心理就会想有哪些替换道路,一个简单的统计观念在我脑中形成,也许我会将路线图量化,然后去选择可能最快的路。像这样简单的思考过程其实就是统计的应用。有句话蛮有道理的,「卫青不败由天幸,李广无功缘数奇」,历代有人成功也有人失败,其实不必喟叹些什么,只因为大家都活在统计里,面对的是一连串的机率过程。是否统计便无法精确呢?其实就像我常说的,除了完全错误外,大概接近对就行了,所以会有什么funnytheory,大概对就好了。但是并非要每个人去当差不多先生,而是因为统计所追求的并不是完全的精确,而是寻求一个合理的精确范围,这是统计很符合人性的特质,学统计的人都知道这个道理,主计长亦是抱持这个观点。

  管子曾说:「不明于数欲举大事,如舟之无楫而欲行于大海也。」意思是说在不清楚相关数据的情况下想做大事,无疑是没有桨的船想航行于汪洋大海中一样。例如政府想扑杀野狗,如果没有野狗分布的数据,不知道野狗形成的来龙去脉,怎么去执行?如何能下决策?再比方先前口蹄疫事件,原先说是一千亿,后来又说是二千亿,最后到四千亿!什么数据都出笼,类似这种情形,便可明白统计的重要。现在有另一种声音,认为统计与信息差不多,统计可以停掉了,并到信息里就行了。并并看吧!并在一起就更知道统计的重要了。实际上信息能处理的还是有限,现在各院处都在推动统计数据库,或首长信息系统,这些东西都着眼于统计与信息的结合,而非将统计并入信息。统计在这个时代所扮演的角色应该是与信息相结合,根据主计长的看法是统计方法的工具观,因为统计是一个很重要的工具,它可以发现问题所在,相当符合现在的类神经网络的观念,透过反复学习与反复的除错,马上再更正除错所遇到的问题,进而以简驭繁,显示出一个大概的趋势。我们经常在求线性模式,虽然很多现象并非线性,但是线性的概念可以马上显示出大概的趋势,知道趋势后,能掌握住这个趋势就不错了,不一定非得掌握住每一个脉动,这就是统计以简驭繁的功能,然后再求新求变,研究下一步的方向,主计长便是把这种统计观念放在他处理预算的工作上。

  现在统计人常感觉士气很低落,认为统计会被并掉,很多单位要裁就先裁统计人员;在学校学生学统计常觉得没有什么出路,不知道毕业后能做什么?主计长很喜欢「战火浮生录」中的一段话,希望我们能等到他创一个统计的新局面,无论是国家统计局或其它统计方面找出一个较精确的出路,如果看过战火浮生录就知道,其实这段话蛮美的也蛮适切的,将这段话--

  『如果妳等我,我一定会回来!但妳要认真的等,全心全意的等!等到天下黄雨,等到天飘白雪!等到妳心意动摇,记忆空白。等到所有的等待,都已静止…..,我一定会回来!』

  再配合美丽的背景,是相当美的境界。你会很甘心的等,等主计长创造历史,也就是我们必须先回过头来面对现实,这就是我想说的「统计的出世及入世观」。

  首先可以确定的是大家都认为统计很重要,这不是我说的,很多人都这么认为,很多人需要统计,无论在学校、机关或业界,无论是县市或各厅处,只要有需要我帮忙的,我一定非常乐意帮忙,因为这是我最大的资源,什么资源呢?我能帮忙就代表我能发现问题、解决问题,从这个角度去看就可以知道很多人都需要统计,无论是工业统计、计量经济、调查管理或生物统计各个领域都认为统计很重要,反而现在只有统计人认为统计不重要。现在健保实施了,生物统计想在卫生署的药检局里积极推动一件事,因为现在任何药的检定是「可」经过统计检定,我们希望把这个「可」改成「得」,任何新药必须先经过统计检定才可以上市,任何人体实验必须经由统计检定才可以通过。美国的NHI就是这么做,所以一方面在国家卫生研究院,一方面在卫生署,我们会积极去推动这个观点,如此一来,无论是生物统计或是医药、农药等各方面都需要统计,更不用说品种试验还是计量经济了。既然每个领域都认为统计重要,统计人该如何去看自己的角色与定位呢?相信很多研究统计的学者常感疑惑甚至产生混淆,比方说有一次中国统计学报与中国统计通讯表明只能送会员一本,结果大部分会员都要选中国统计通讯,经过我询问的结果,原来大家觉得中国统计通讯才看的懂,怕看不懂中国统计学报。其实这是一个蛮大的问题,并不是我们要否定学术,假如你看过由美国统计学会出版的一本很有名的管理杂志--JASA,它在世界上统计类杂志的排名应该有前五名,若除开原文的因素,在后段至少有三分之一的文章是容易看得懂的,因为后面有很多是属于CASESTUDY,没有太多数学公式,他告诉你怎么分析奥运选手的纪录,告诉你怎么分析一些工业污染指数的技术,这些东西有没有学问?学问可大了!但在国内我们反而常会认为没有公式就没有学问,就像我为学生口试论文时,学生给了我一堆公式,结论却只有一点点,问他那些公式是什么?学生说不写一些公式好像会让人觉得没有学问,这就是一个盲点。任何产业、领域都有其上中下游,统计也一样,基本上会先有一个理论或方法论,再来才是数据分析,在上中下游互相循环推动下,产生领域的专业性,但是我们常把统计陷入数学的泥沼里,以为统计就是数学堆砌出来的,因此发生疑惑,数学当然是统计的基础,它绝对有其重要性,就像物理电子对信息产业的重要性一样,但是信息业以及各项软硬件设施之发展方向却又比电子领域更广,同样的道理,统计虽可视为由数学所发展出的旁支,但是统计在应用科学上更加发挥了可长可久的境界,此时统计在各个领域中扮演着越来越重要的配角,也就是前面提过的理论方法与数据分析间的关系。很多人常认为数据分析不重要,学问不大,其实真正的学问就在此,如何将数据整合?如何定义数据?如何转换数据?以何种方法处理数据?类似这种情形,并非单靠纯粹的理论就可以解决,所以统计在各领域中也就益加显出其重要性了。举个例子来看,瑞辉大药厂里光是一个researchcenter就有一百多个统计人员,差不多是我们主计处的三四局,由此可见其重视统计的程度,一个药厂已是如此,更不用说是NHI或是国家卫生研究院了。

  我自己做过一个简单的调查,市面上出版的统计中文书至少有一半甚至三分之二以上都不是学统计出身的人写的,在这里我没有批评的意思,好比大家在准备高普考,手边经常拿着颜月珠教授的统计学,颜教授本身并不是统计出身,但是却写了很多统计学的书。问题出在哪里?非本门科系的人都懂统计,他们学了很多东西后发觉统计很重要,所以回头来写统计的书,最近台大商学院也出了两本统计,类似四人帮写的经济学一样,写的相当不错。由此可以看出别人都很重视统计,尤其经济学中的计量经济更是重视,他们或许正暗自窃笑,你们统计人好像都不重视统计,刚好让我可以涉足进来分一杯羹。而统计人却又常把统计写的太像数学,使人觉得统计不是那么平易近人。另外,环顾现在研究所硕博士补习班教统计的老师,大部分都不是学统计出身的,而是学经济、企管等相关科系的,他们学统计、考统计是一把罩,长此以往,若是统计人再不振作,那别人最高兴了,他们学本行一把罩,统计方面又是一把罩,由大约百分之六七十的研究所都考统计这点可看出统计对其他领域的重要性,他们希望把统计的观念与技巧都学过去。这时统计人应该更有信心,在学习上、在专业领域里更加努力,我想强调一点,作为一个统计人的正确观念应该是—把人家的本事学过来。

  我现在主要从事民意调查的工作,而民意调查的核心实际上就是统计中的抽样。所以要是统计这部分做不好,其它无论再加上什么社会学、政治学都没有用,但是换个角度想,除了把统计做好外,更要去学政治学、社会学这些相关学问来解释统计的结果。学习别人的专业并非全部都要学,而是挑重点学,因此在学校里我经常鼓励学生修习第二专长,最好去修辅系,哪怕是文学院或音乐系都好,别以为没有用,辅大音乐系主任就经常找我,他常常在分析不同时代或不同音乐家的音乐特性,因为音乐是可以量化的,而统计当然可以解决量化过的数据;另外在文学院,无论台湾或大陆学者都在分析红楼梦到底是不是曹雪芹写的,有些人认为是它的自传,有些人认为后半不是出于其手,他们利用统计中多变量分析的主成分分析法来研究,怎么做呢?以书中出现「之、乎、者、也」的频率经过量化后去分析;清大江永进教授研究母语时经常到菜市场搜集每个人讲话的音频以及词汇运用的频率,希望藉由统计分析后能编出一部台语的辞典。文学院和音乐系利用统计的情形尚且如此,更不必说其它科系了!所以我希望统计人能培养第二专长,以统计为核心再去学别人专业的部分,如此才会有更广阔的发挥空间。

  我本身并非社会学者,更不是政治学者,但是在民意调查的工作当中,我会很虚心的去学习他们的专长,以便做出正确的判断。例如总统大选的时候,统计报表出来后,我会观察瞿海源教授他们怎么去分析,有哪些观点,另外我会去看一些政治或社会学方面的书,慢慢的我可以明白专家怎么去看统计数字,因为从社会学或政治学的角度去看统计数字和我们一般看数字的角度是不一样的,因而此时身为统计人一定要有一种心理建设,要去把别人的东西给学过来,而不是只在统计领域中钻营而已。很多人跟我说现在的统计分析太容易也太简单了,把资料丢进MINITAB、SAS、SPSS,结果就出来了,我常笑着说这叫做「GARBAGEIN, GARBAGEOUT」,把一份不明缘由的数据扔进统计软件,跑出来的分析结果还是不明究理,垃圾进去垃圾出来,一蹋胡涂也一片朦胧,唯有统计专业人员才比较懂得如何去分析,懂得如何善待与利用数据,因此身为统计人一定先要有统计方面的专业素养与技术,在此想强调的是统计有用论,至于如何使其有用?这就是我的主题—统计的出世与入世观。

  我经常用算命来解释统计有用论,常在报章杂志上出现的命相大师文昌居士曾说过一句话,「算命就是另类统计学」,没错,统计学里的empiricalrule、bayesian prior information、posteriorprobability等等,都很符合算命的精神,而算命的过程当中,无论是紫微命盘或是排八字等方法,其实也都是机率和排列组合的问题,至于看手相则可视为一种经验累积,而经验的累积正是统计学简单的基础。所以我常说学统计的人很适合去算命,也常和学生开玩笑说大概四、五十岁后要去开命理馆,因为这也算是家学渊源,外祖父远从清朝便在泉州学算命,后来成为算命师后,我常在一旁帮他温酒,舅舅现正在南部凤山帮人看相,有时候会开玩笑地跟舅舅说,反正算命又算不死人,你这样算到底准不准啊?他说准不准在个人,信不信也在个人。实际上这一整个过程对我来说都蛮清楚的,假如学统计的人可以将之理论化、科学化,绝对可以做的更好的,因为算命的基本背景就是统计资料,任何算命师的观点都是一种统计资料,好比现在省府经常在推动的统计数据库或是首长信息系统,将来就是一个很重要的首长算命系统,赖以决定用人的准则。所以统计对各领域的需求而言都是相当重要的。

  从前常把统计形容成笑傲江湖小说中任我行的吸星大法,现在觉得太邪气了,应该用天龙八部中的北冥神功来比喻,基本上都是一种吸纳整理的观念,因为统计可以将庞杂无章的数据经由整理分析后成为有用的信息,这是统计最powerful的功能。现在大家学统计、用统计,必须抱持一个观念,「统计就是生活、统计就是人生」,你投入的工作就是你的生活,你投入的工作就是你的人生,在研究统计当中培养工作和人生之间紧密的结合,你会发现这是相当有趣的。另外我们来看看统计的时代意义,1992年世界上最好的杂志Science有一篇报导「Statisticdata analysis in the computerage」,现今计算机的普及率节节高升,很多人认为计算机发达后统计就没有价值了,其实正好相反,计算机愈是普及、愈是发达,就愈能带动统计发展,提升统计运作的效能,从前跑一个回归分析就得花好久的时间,现在只是弹指之间的事,更不用说是多变量分析了。计算机让统计变简单,并不代表学统计没有用了,并不代表数学不见了,因为数学正是这些计算机统计软件的背书,是理论的基础。其实我们真正该考虑的一点是改革统计教育,因为在这个计算机时代里教学生去算微积分、去背公式,都是没有意义的动作,现在MAPLE、MATHMATICS、MATLAB等等软件都可以解决高等微积分的问题,重点应该是教导学生如何去利用这些工具,如何去应用,我们教初等统计学时,一开始就是一堆Σ、θ、∫∫∫什么的,商学系的学生一看就昏倒,该教的是让他们知道统计有什么用,变异数是什么意义、回归分析的应用范围在哪里、机率分配的定义是什么、数据分析该怎么进行、而不是一开始在前三章就硬塞一堆分布跟公式,看到这些统计公式很多人就傻眼了,因而对统计产生距离感,其实统计应该是一个很亲切、很实在的东西,和计算机结合后更是形成一种非常powerful的工具,这些都是我实现于教学及工作上的的观点。

  统计一定要跟信息结合,而非哪一方并掉哪一方,现在如果有人还存有谁并谁的观念,它不但不懂信息,更不懂统计!更甚者有人认为要裁掉统计基层调查网,裁吧!裁了就知道厉害了,建立一个调查网十分不易,改善调查网更是重要,既然已经辛辛苦苦地建好调查网,怎么可以随便撤掉呢?少了调查网的话,物价怎么出来?人力资源报告怎么出来?将来整个世界评比的结果,我们的统计指标会是倒数几名,那么谁还敢相信我们的东西?就像现在的中国大陆,大家都拿他们的统计指标再乘上某数,调查物价时不许抽样的物品涨价,其它的涨翻天都不管,这叫做控制物价指数,像这样的指数能相信吗?这样还需要调查吗?我告诉你就好了嘛!这种情形就是不懂统计的人在做统计,所以统计人应该很诚恳的告诉他们若是失去这片天地会造成多大的影响,并不是我们在自吹自擂,而是统计的确有其实用性,没有统计的话,所作决策失败的机率就愈高,这一点身为决策者应该让主管了解。至于统计在未来学界的发展,刁院士已于清大筹设一个整合数量、计量、经济、企管、财经各领域的人才的组织,并报导在经济日报上,因为台湾正朝向亚太营运中心的目标迈进,所以培养计量分析人才是当务之急,而统计就是计量分析的基础,这是一个未来极具前瞻性的发展。统计现正在主计处中部办公室大力持续推动支持下要成立统计数据库,相信一定会开花结果的。另外全球商情信息系统也已进军台湾,因为在台湾的数据库有相当丰富的商机,尤其是统计数据库,因此公务单位必须正视这个问题,这也就是我一直强调的将信息与统计结合以发挥相乘效果,而不是谁并谁这种无稽的想法。

  SCIENCE有一篇文章列出近百年来最有用的科学,统计高居前十名,而统计在各领域中扮演的是服务大众的角色,是整合所有数据及信息的重要角色。而台湾在统计方面的另一个发展方现就是consultantcenter,如今几乎每一个大学统计系都已经成立统计咨询顾问中心,无论逢甲也好、东海也好,希望政府中的统计相关单位能尽量利用,就近询问这些统计咨询顾问中心,相信他们都会很乐意帮忙的。不管是学界或业界,统计有用的观念已经渐渐形成,并且已有人开始构思成立类似企管顾问公司或咨询顾问公司一般的统计咨询顾问公司,因为资料愈来愈有用,卖数据正是时势所趋,例如民间单位的中华征信社,他们每年赚的钱其实有一部分是大家帮他们赚的,因为他们把搜集到的统计数据经过加工处理后再卖给厂商,一卖就是十万二十万,所以像我们这些经常在做数据生产者的人却没有进一步成为资料的加工者或再制造者,其实是非常可惜的,大家应该考虑结合成立统计咨询顾问中心来进一步运用统计。

  在台湾统计的发展根据国科会自然处里面中数学方面的统计小组所拟出来的包括有理论统计以及应用统计,所谓应用统计则包含工业统计及生物统计等等,我总觉得少了一种很重要的统计--政府统计,在国外,无论是瑞士、瑞典或美国等国家,最重视的就是政府统计,因为政府统计是一个最大的资料来源。在台湾普遍存在一种情形,就是统计领域的上中下游常出现断层,我常说我是个阳春教授,是统计黑手,要是你有问题找我解决,我不见得会用很有学问的方法帮你解决,可能是找个比较实用的方法来处理问题,其实台湾有许多功力高强的学者,但是他们通常不愿意下海当黑手,这就是上游不见得愿意帮忙中下游解决问题,而中下游又感觉上游遥不可及,不敢把问题告诉上游,觉得上游的理论太过高深,听过降龙十八掌,却又不知道是哪十八掌,是故上中下游的循环发生断层,这是我认为应该加强的地方。另外还有一个重要的问题是应该淡化统计的理学院色彩,现在统计这领域愈来愈偏向管理学院或商学院,目的就是希望统计在这些领域中和其它学科互相结合。以美国ASAsection的homepage为例,其中分成许多的section,连统计画图都自成一个section,环境方面、体育方面无所不包,提到体育,美国之所以能成为体育强国,中国大陆之所以能培养出那么多优秀运动员,都应该归功于他们的体育分析做的好。其它还有医药方面的卫生统计及公共卫生,社经方面的民意调查,在此不一一介绍,由此可知他们是多么重视统计,没有统计对他们而言就像是断手断脚一般,我们身为统计人就是应该让主管及决策者认为没有统计就好像缺手缺脚似的不便。我现在每个月固定在学校扮演一种角色,就是把省府的统计月报以及主计处的重要国情统计等重要的信息摘要整理后提供各系参用,让各系定期感受我们整个国家社会的脉动,试验两个月后,我想停掉这个工作,结果至少有二十个系主任打电话请我不要停,他们觉得这些资料对他们很有用,从这一点看来我是成功了,所以只要愿意花心思去凸显统计在各单位的整合性,一定可以让人家感受到有统计是多么方便。比方要分析交通业务,只要跟业务单位充分配合,无论是载客量或交通流量,当你分析完成后,有你没有你就出现很大的差异了,统计在这个单位中一定会愈来愈吃香,变成一个不可或缺的重要决策资源单位。

  主计长曾指导过关于统计的分析观点以及技巧,希望在各领域中奋斗的统计人也都能有这种认知,那就是要对数字有感情,有这种感觉后便更能掌握数字,更知道如何将数字便成有用的信息,提供决策者参考,如此才能在基础中不断求新求变。

  每个人都经常会为了许多事情烦恼,会为了生、老、病、死担忧,至于统计人应如何利用统计的观点去面对人生呢,就我而言也许有点像三国演义的卷头语写的「滚滚长江东逝水,浪花淘进英雄,是非成败转头空,青山依旧在,几度夕阳红,白发渔樵江渚上,惯看秋月春风,一壶酌酒喜相逢,古今多少事,都附笑谈中」。如同前面所提,没有永远的永久,统计诉说的只是一个趋势,预测一个现象,这些趋势和现象会随着时间的变动、随着物换星移,永远无法有人能掌握永久,假使有人问我时间序列分析能不能预测到十年后、二十年后、甚至三十年后,我会说「你是疯子」,那是不可能的!统计掌握住的是趋势,它能告诉你在不同时间的不同变量有什么不同的看法,模式如何随之修正,所以不管从纵切面或横切面去了解统计给你的趋势,进而掌握这个趋势,才去下比较正确的判断,这不仅仅是统计人的工作与职责,更是统计人的人生观,统计人并不是差不多先生,统计人看的开、达观、豁达、不争名、也不求利
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值