《数学之美》---笔记005
第十七章:谈谈密码学的数学原理
1、明码 加 密 解 密密码
2、一般来讲,当密码之间分布均匀并且统计独立。
3、公开密钥的好处:1、简单,就是一些乘除运算;2、可靠,公开密钥方法保证产生的密文是统计独立而分布均匀的。,一般来讲,我们无法根据已知的明文和密文的对应来破译下一份密文。
4、密码学的最高境界是无论敌方获取多少密文,也无法消除己方情报系统的不确定性。
第十八章:搜索反作弊问题和搜索结果权威性问题。
- 任何搜索引擎给出的结果都不是很完美,多少都会有点噪声
- 作弊方法:1、早期使用重复关键字;2、有了PageRank算法后,就有专门买卖链接;
- 解决问题的方法:1、从信息源出发,加强通信(编码)自身的抗干扰能力;2、从传输来看,过滤掉噪音,还原信息
- 每个网站到其他网站的出链数目可以看作一个向量(网站固有特征),我们就可以计算余弦距离,一般来讲余弦距离几乎为1的,说明他正交不相关,那么可以判断他的目的就是卖链接。
- 搜索结果权威性,计算权威度的步骤,1、对网页中正文中的每一句话进行句法分析;2、利用互信息;3、对主题短语进行聚合(矩阵)4、对一个网站中的网页进行聚合,权威性的度量只能建立在紫玉或者子目录这一级。
反作弊思路:去噪声。搜索结果权威性思路:如何对权威性进行度量
第十九章:谈谈数学模型的重要性
- 天文学:托勒密发明了球坐标以及弧度制,还定义了包括赤道和零度经线在内的经纬线,还提出了黄道。
- 结论:1、一个正确的数学模型应当在形式上是简单的;2、一个正确的数学模型一开始可能还不如一个精雕细琢过的错误的模型来的准确,但是,如果我们认定大方向是对的,就应该坚持下去;3、大量准确的数据对研发很重要;4、正确的模型可能受噪音干扰,而显得不正确;这时不应该用一种凑合的修正方法加已弥补,而是找到造影的根源,这也许能通往重大的发现。
第二十章:谈谈最大熵模型
- 不要把鸡蛋放到一个篮子里,这个在数学上称为最大熵原理,即保留全部的不确定性,将风险降到最小;
- 最大熵原理指出:对于一个随机事件的概率分布进行预测时,我们预测应当满足全部已知的条件,而对未知的情况不要做任何假设。
- 最大熵模型的训练,最大熵模型在形式上非常简单,但是实现上确异常复杂
- 最大熵模型的训练方法:通用迭代算法GIS,改进迭代算法IIS
- 投资方面:证券股票等交易需要考虑非常多的复杂因素,因此使用最大熵模型可以取得很好的效果。
最大熵模型:他是惟一一个计能满足各个信息源的限制条件,又能保证平滑性的模型。