目录
1 什么是人工智能
- Artificial Intelligence,亦称智械、机器智能,
- 指由人制造出来的机器所表现出来的智能
- AI的核心问题包括建构能够跟人类似甚至超卓的推理、知识、规划、学习、交流、感知、移物、使用工具和操控机械的能力等
2 人工智能的分类
- 弱人工智能 如除了语音识别,啥都不能干
- 强人工智能 如自动驾驶
- 超人工智能 全能,推理能力
3 人工智能研究分支
- 机器学习AI (Machine Learning AI)
- 机器学习是要在大数据中寻找一些“模式”,然后在没有过多的人为解释的情况下,用这些模式来预测结果,而这些模式在普通的统计分析中是看不到的
- 大量的数据
- 发现规律
- 机器学习是要在大数据中寻找一些“模式”,然后在没有过多的人为解释的情况下,用这些模式来预测结果,而这些模式在普通的统计分析中是看不到的
- 深度学习(Deep Learning)
- 人工神经网络
- 是机器学习中最热门的算法
4 机器学习
- 人工智能的一个分支
- 什么是学习?
一个成语就可概括:举一反三,懂解题方法,因此考场上面对陌。高考为例,高考的题目在上考场前我们未必做过,但在高中三年我们做过很多很多题目生问题也可以算出答案 - 推理机器学习在近30多为主线,从数据中自动分析获得规律
- 近年已发展为一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科
- 设计和分析一些让计算机可以自动“学习”的算法
- 什么是学习?
4.1 机器学习的核心任务
训练过度,虽然准确度很高,但是不符合实际应用,左边的训练成果已经很好了
4.2 学好机器学习的第一原则和要义
4.3 机器学习分类
- 监督学习(有目标的,如年龄和肿瘤良性恶性是否有关系)
- 无监督学习
- 最简单也最普遍的一类机器学习算法就是分类(classification)。对于分类,输入的训练数据有特征(feature),有标签(label)。所谓的学习,其本质就是找到特征和标签间的关系(mapping)。这样当有特征而无标签的未知数据输入时,我们就可以通过已有的关系得到未知数据标签。
- 在上述的分类过程中,如果所有训练数据都有标签,则为有监督学习(supervised learning)。如果数据没有标签,显然就是**无监督学习(unsupervised learning)**了,也即聚类(clustering)。
- 半监督学习介于两者之间,部分有答案
监督学习
无监督学习
“自学成才”,没有老师的“指导”,没有明确的目的。要回答的问题是“从数据X中能发现什么”。
通过无监督学习,我们可以快速把行为进行分类,虽然我们不知道这些分类意味着什么,但是通过这种分类,可以快速排出正常的用户,更有针对性的对异常行为进行深入分析。
-
案例1:发现异常
- 有很多违法行为都需要”洗钱”,这些洗钱行为跟普通用户的行为是不一样的,到底哪里不一样?
- 如果通过人为去分析是一件成本很高很复杂的事情,我们可以通过这些行为的特征对用户进行分类,就更容易找到那些行为异常的用户,然后再深入分析他们的行为到底哪里不一样,是否属于违法洗钱的范畴。
-
案例2:用户细分
- 这个对于广告平台很有意义,我们不仅把用户按照性别、年