初识机器学习

最新推荐文章于 2023-12-27 01:47:14 发布

fsafgfhujff

最新推荐文章于 2023-12-27 01:47:14 发布

阅读量60

点赞数

文章标签：机器学习

本文链接：https://blog.csdn.net/y1366210615/article/details/124070395

版权

机器学习：

1.概念

Simple and efficient tools for predictive data analysis
【预测数据分析结果】

用机器代替人做决策

数据集 =》 训练 =》 模型 

2.Built on NumPy, SciPy, and matplotlib、pandas

2.机器学习里面的常用术语：

1.数据集准备
	色泽= 绿色 、根=弯曲 、 敲声 = 浑浊  =》 熟的 
	色泽= 黑色 、根=弯曲 、 敲声 = 沉闷  =》 生的 
	色泽= 红色 、根=弯曲 、 敲声 = 清脆  =》 生的

数据集：这组数据 的集合 
样本：每一条数据
维度：西瓜的判断条件
标签(label)：结果的判断就是标签

2.模型怎么来的？ 

	数据集 =》 训练 =》基于某个算法 =》 模型 【数学公式】

机器学习的模型作用：
	输入三个维度 =》 判断出结果

人少：
机器学习: 数据科学家【基于数据 =》分析一些问题】
1.数学 =》算法 knn、kmeans 、线性回归、逻辑
2.会写代码

3.机器学习的种类：

1.有监督学习： 结果是 label的
	1.分类：
		通过模型 判断结果  生的还是熟的
	2.回归： 
		通过模型 判断结果 （熟了 0.9）
2.无监督学习：结果是 没有label的
	1.聚类： =》 sql  group by 
3.半监督学习: 
	使用标记数据+为标记数据 进行训练
4.强化学习：
	阿法狗

4.如何判断模型好不好？

*1.正确率、错误率*
	正确率：（tp+tn） / (tp+tn+fp+fn)
	错误率率：（fp+fn） / (tp+tn+fp+fn)
*2.精确率、召回率*
	P 精确率：（tp） /(tp+fp) 
	R 召回率：(tp) /(tp+fn)
*3.真正率、假正率：*
~~删除线格式~~ 
True Positive Rate（真正率 , TPR）或灵敏度（sensitivity） 
TPR = TP /（TP + FN） 正样本预测结果数 / 正样本实际数
~~删除线格式~~ 
True Negative Rate（真负率 , TNR）或特指度（specificity） 
TNR = TN /（TN + FP） 
负样本预测结果数 / 负样本实际数
~~删除线格式~~ 
False Positive Rate （假正率, FPR） 
FPR = FP /（FP + TN） 
被预测为正的负样本结果数 /负样本实际数
~~删除线格式~~ 
False Negative Rate（假负率 , FNR） 
FNR = FN /（TP + FN） 
被预测为负的正样本结果数 / 正样本实际数

fsafgfhujff

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
初识机器学习

机器学习：1.概念Simple and efficient tools for predictive data analysis【预测数据分析结果】用机器代替人做决策数据集 =》训练 =》模型 2.Built on NumPy, SciPy, and matplotlib、pandas2.机器学习里面的常用术语：1.数据集准备色泽= 绿色、根=弯曲、敲声 = 浑浊 =》熟的色泽= 黑色、根=弯曲、敲声 = 沉闷 =》生的色泽= 红色、根=弯
复制链接

扫一扫