数学之美---百科

上一次介绍了作者吴军编写的“数学之美”的前两章,讲的是自然语言从他产生之初,逐渐演变成一种上下文相关的信息表达和传递的方式,因此让计算机处理数学语言,就是为自然语言这种上下文相关文法的特性建立数学模型,而这数学模型,就是现在很流行的机器翻译,语音识别,拼音纠错等对自然语言处理的基础。

这次便写一下接下来的两章。

第三章,统计数学模型

统计数学模型:百度百科解释为:统计模型[stochasticmodel;statisticmodel;probabilitymodel]指以概率论为基础,采用数学统计方法建立的模型。有些过程无法用理论分析方法导出其模型,但可通过试验测定数据,经过数理统计法求得各变量之间的函数关系,称为统计模型。常用的数理统计分析方法有最大事后概率估算法、最大似然率辨识法等。常用的统计模型有一般线性模型、广义线性模型和混合模型。统计模型的意义在对大量随机事件的规律性做推断时仍然具有统计性,因而称为统计推断。常用的统计模型软件有SPSS、SAS、Stata、SPLM、Epi-Info、Statistica等。

  • 用数学的方法描述语言规律

统计语言模型最初是为了解决语音识别的问题。大家都知道语言的魅力所在就是不确定性,因为有掺杂着人类的情感,以及地域等等的因素所在,一句话有很多种不同的表达方式和表达意思。所以,在于语音识别的领域,都是最大的问题。目前而言,语音识别有很大的进步,一句话的词法,词义,一句话是否合理,就看看他的可知性的大小。

 

 

 

附---百度百科解释

多变量统计分析主要用于数据分类和综合评价。综合评价是区划和规划的基础。从人类认识的角度来看有精确的和模糊的两种类型。因为绝大多数地理现象难以用精确的定量关系划分和表示,因此模糊的模型更为实用,结果也往往更接近实际。模糊评价一般经过四个过程:

(1)评价因子的选择与简化;

(2)多因子重要性指标(权重)的确定;

(3)因子内各类别对评价目标的隶属度确定;

(4)选用某种方法进行多因子综合。

1.主成分分析

地理问题往往涉及大量相互关联的自然和社会要素,众多的要素常常给模型的构造带来很大困难。为使用户易于理解和解决现有存储容量不足的问题,有必要减少某些数据而保留最必要的信息。

主成分分析是通过数理统计分析,求得各要素间线性关系的实质上有意义的表达式,将众多要素的信息压缩表达为若干具有代表性的合成变量,这就克服了变量选择时的冗余信息,然后选择信息最丰富的少数因子进行各种聚类分析,构造应用模型。[2] 

2.层次分析法(AHP)

Hierarahy Analysis 是T.L.Saaty等在70年代提出和广泛应用的,是系统分析的数学工具之一,它把人的思维过程层次化、数量化,并用数学方法为分析、决策、预报或控制提供定量的依据。

AHP方法把相互关联的要素按隶属关系分为若干层次,请有经验的专家对各层次各因素的相对重要性给出定量指标,利用数学方法综合专家意见给出各层次各要素的相对重要性权值,作为综合分析的基础。例如要比较n个因素y={y1,y2,…,yn }对目标Z的影响,确定它们在z中的比重,每次取两个因素yi和yj,用aij表示yi与yj对Z的影响之比,全部比较结果可用矩阵

  

表示,A叫成对比矩阵,它应满足:

使上式成立的矩阵称互反阵,必有

  

3.系统聚类分析

60年代末到70年代初,人们把大量精力集中于发展和应用数字分类法,且将这类方法应用于自然资源、土壤剖面气候分类、环境生态等数据,形成“数字分类学”学科。聚类分析已成为标准的分类技术,在许多大型计算机中都存储了这种分析程序,从GIS数据库中将点数据传送到聚类分析程序也不困难。

聚类分析的主要依据是把相似的样本归为一类,而把差异大的样本区分开来。在由m个变量组成为m维的空间中可以用多种方法定义样本之间的相似性和差异性统计量。

4.判别分析

判别分析是根据表明事物特点的变量值和它们所属的类求出判别函数,根据判别函数对未知所属类别的事物进行分类的一种分析方法,与聚类分析不同,它需要已知一系列反映事物特性的数值变量值及其变量值。

判别分析就是在已知研究对象分为若干类型(组别)并已经取得各种类型的一批已知样品的观测数据基础上,根据某些准则,建立起尽可能把属于不同类型的数据区分开来的判别函数,然后用它们来判别未知类型的样品应该属于哪一类。根据判别的组数,判别分析可以分为两组判别分析和多组判别分析;根据判别函数的形式,判别分析可以分为线性判别和非线性判别;根据判别时处理变量的方法不同,判别分析可以分为逐步判别、序贯判别等;根据判别标准的不同,判别分析有距离判别、Fisher判别、Bayes判别等。

判别分析与聚类分析同属分类问题,所不同的是,判别分析是预先根据理论与实践确定等级序列的因子标准,再将待分析的地理实体安排到序列的合理位置上的方法,对于诸如水土流失评价、土地适宜性评价等有一定理论根据的分类系统定级问题比较适用。

在地理信息系统中发展了一种多因素模糊评价模型,相当于模糊评判分析。该方法首先根据标准类别参数的指标空间确定各因素各类别对目标的隶属度,作为判别距离的度量,再结合要素的权重指数,采用适当的模糊算法,计算各地理实体的归属等级类别,作为评价的基础。该方法通过隶属度表达人们对目标与因素之间关系的模糊性认识,用适当的算法将这种认识量化并反映到结果的分类中,对于地理学中的评价与规划问题非常有效。

 

 

 

 

 

 

 

 

 

 

 

 

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值