在读了吴军老师《数学之美》这本书后,才发现原来所学的数学知识在生活中的方方面面都有所运用,很多现实的问题都可以转换成合适的数学模型去解答,以下是我从中所了解到的一些知识。
1.信息的冗余是信息安全的保障
2.罗塞塔石碑的破译—–了解了5000年前的埃及历史
图灵测试
让人和机器进行交流,如果人无法判断自己交流的对象是人还是机器,就说明这个机器有智能了。
分词:中文信息处理的基础
几个模型
- 统计数学模型:被广泛运用于机器翻译、语音识别、印刷体或手写体识别、拼写纠错、汉字输入和文献查询
- 隐含马尔可夫模型:应用于通信领域,然后被推广到语音和语言处理,成为连接自然语言处理和通信的桥梁,同时也是机器学习的主要工具之一
搜索引擎
1. 布尔代数
搜索引擎最重要的是建立索引,索引又是基于数据库的,数据库的查询语句(SQL)支持各种复杂的逻辑组合,背后的基本原理是基于布尔运算的。
2. 图和网络爬虫
图是离散数学中的一个重要知识点。
自动下载互联网的网页:图论的遍历算法
- 深度优先遍历:先访问相邻结点,再通过相邻的访问到所有(一条路走到黑)
- 广度优先遍历:先访问相邻的结点,再通过这些相邻的结点去访问与其直接相邻的结点(范围尽可能广的去访问)
网络爬虫:通过超链接,从任何一个网页出发,用图的遍历算法自动访问到每一个网页并把它们存起来,并通过“哈希表”来记录已经被下载过的网页
URL:统一资源定位符(指出文件的位置以及浏览器应该如何处理)
新闻分类:应用余弦定理
文本自动分类:期望最大化算法
人工神经网络应用:语音识别、机器翻译、股票预测等
大数据:多维度和完备性
分治法:将一个简单的问题,分成若干个简单的子问题进行解决,然后,对子问题的结果进行合并,得到原问题的解。
计算复杂度:P问题、NP问题、NPC问题
P问题:在多项式时间内能解决的问题(NP的子集)
NP问题:可以在多项式时间内里验证一个解的问题,不论目前这个问题能否找到多项式复杂度算法
NPC问题:是NP的一个子集,且其中每一个问题均能由NP中的任何问题在多项式时间内转化而成
一些提及的知识点
- 数据挖掘
- Google云计算
- 搜索广告和逻辑回归
当遇到比较麻烦问题的的时候,先解决80%的问题,再慢慢解决剩下的20%问题,不要一开始就追求大而全。
2017.12.18