人工智能发展四个阶段
初期阶段
- 机器翻译
- 博弈
- 通用问题求解(GPS)
认为利用计算机的运算能力可以解决一切问题,太过于理想化。
智能系统必须有知识才能够实用。
知识时代
- 专家系统:将某一个行业的知识提取总结出来,让计算机使用,从而解决该领域的问题
- 知识工程:建造大型知识库,来解决问题,如何让计算机使用问题
- 知识表示
问题:知识获取的瓶颈问题?
例如:如何骑自行车?有些知识很难表述总结,只可意会不可言传。
特征时代
- 统计学习方法
- 优化技术
- 特征映射
- 人为特征定义:人与计算机对特征的理解不同(如语音识别)
数据时代
- 深度学习
- 表示学习
- 自动特征抽取
- 不同层次的抽象特征
- 特征映射(深层)
共同特点:如何定义问题
人工智能 = “定义” + 算法
深度学习并不是一切:
- 语音识别
- 图像识别
- 人脸识别
- 字符识别
- 机器翻译
垃圾网页识别
垃圾网页:通过作假手段提高其在搜索引擎中排名的网页;严重影响搜索引擎的识别
缺少通用的识别方法:各个垃圾网页的作假手段都不相同
基于用户行为的垃圾网页识别
垃圾网页的目的:通过欺骗搜索引擎骗取用户的访问和点击
用户对于正常网页和垃圾网页的行为是不一样的
用户行为特征:
- 用户停留时间
- 用户继续点击率
- 搜索引擎引导率
利用统计学习方法建模、分类
深度学习存在的问题
- 大数据 vs 小样本:当数据量不足时如何解决
- 黑箱 vs 可解释:无法解释深度学习模型内部的逻辑原因
- 一次性学习 vs 增量学习:当数据特征出现变化时原来模型不再适用