AI学习第二天

人工智能项目的经典流程

- 第一步:分析问题,搞定输入和输出
- 第二步:根据输入和输出,构建数据集
- 第三步:遴选一种算法,完成输入到输出的映射
- 第四步:算法部署,系统集成

数据科学 data science

- 一切都得变成一个数字才行!!!

鸢尾花分类(3类)

- 第一步:分析问题,搞定输入和输出
	- 1. 输入:花;输出:类别
	- 2. 输入:???;输出:???
		- 输入:如何数字化一个实体(entity)?
			- 用这个实体的特征/属性来刻画这个实体!!!
			- 颜色?大小?重量?....
			- 需要业务专家!!!
			- 花农!!!
				- 四个属性:花瓣长,花瓣宽,花萼长,花萼宽
		- 输出:从零开始编号:0, 1, 2 ...(zero index)	
	- 3. 一个样本:花瓣长,花瓣宽,花萼长,花萼宽,类别编号

- 第二步:每个类别各采集50朵花:
	- 花瓣长1,花瓣宽1,花萼长1,花萼宽1,类别编号1
	- 花瓣长2,花瓣宽2,花萼长2,花萼宽2,类别编号2
	- 花瓣长3,花瓣宽3,花萼长3,花萼宽3,类别编号3
				...
	- 花瓣长150,花瓣宽150,花萼长150,花萼宽150,类别编号150

- 第三步:选择一种算法,完成输入到输出的映射
	- 分类算法
		- KNN:K紧邻算法
		- GNB:高斯贝叶斯
		- DT:决策树算法
		- SVM:支持向量机
		- RF:随机森林算法
		- 集成学习算法
	
- 第四步:部署,集成

KNN算法

- 算法:algorithm 计算机解决问题的步骤:
	- 第一步:...
	- 第二步:...
	- 第三步:...
- KNN: K-Nearest Neighbors K个最近的邻居
- 核心理念:
	- 近朱者赤,近墨者黑
	- 跟什么样的人在一起,你就会变成什么样的人!!!
- 训练:
	- 惰性计算算法
	- 规则 + 数据,不是严格意义上的人工智能算法

- 推理流程:
	- 给定一朵花,如何判定它是第几类?
	- 第一步:找出这朵花 K 个最近的邻居(最好的兄弟,闺蜜)
		- 最近?最远?
		- 相似度的度量
			- 从数据的视角来看:
				- 几何视角:
					- 欧式空间:距离计算
						- 勾三股四玄五
						- 两点之间的直线距离
				- 向量视角:
					- 余弦相似度:
	- 第二步:K个邻居进行投票,选出类别出现次数最多的类
  • 3
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

孙其自然Y

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值