课程链接: 清华大学驭风计划
代码仓库:Victor94-king/MachineLearning: MachineLearning basic introduction (github.com)
驭风计划是由清华大学老师教授的,其分为四门课,包括: 机器学习(张敏教授) , 深度学习(胡晓林教授), 计算机语言(刘知远教授) 以及数据结构与算法(邓俊辉教授)。本人是综合成绩第一名,除了数据结构与算法其他单科均为第一名。代码和报告均为本人自己实现,由于篇幅限制,只展示任务布置以及关键代码,如果需要报告或者代码可以私聊博主
机器学习部分授课老师为张敏教授,主要主要通过介绍决策树,线性回归,贝叶斯模型,SVM算法,K近邻算法,Kmeans算法以及集成学习算法等入门机器学习。
有任何疑问或者问题,也欢迎私信博主,大家可以相互讨论交流哟~~
一、案例简介
图像的智能处理一直是人工智能领域广受关注的一类技术,代表性的如人脸识别与 CT 肿瘤识别,在人工智能落地的进程中发挥着重要作用。其中车牌号识别作为一个早期应用场景,已经融入日常生活中,为我们提供了诸多便利,在各地的停车场和出入口都能看到它的身影。车牌号识别往往分为字符划分和字符识别两个子任务,本案例我们将关注字符识别的任务,尝试用 K-NN 的方法对分割好的字符图像进行自动识别和转化。
二、作业说明
基本要求
- 完成数据的读入和表示,将图片表示成向量并和 label 对应上;
- 构建 K-NN 模型(可调库)对测试集中的图片进行预测并计算准确率;
- 分析当 K 取不同值时测试准确率的变化。
扩展要求
- 分析不同距离度量方式对模型效果的影响;
- 对比平权和加权 K-NN 的效果;
- 分析训练集大小对测试结果的影响。
三、结果展示
不同相似度计算方式下的score
不同数据集大小下的score
不同K大小和权重下的对比