- 博客(6)
- 收藏
- 关注
原创 机器学习sklearn k-近邻算法
定义:如果一个样本在特征空间中的,则该样本也属于这个类别。来源: KNN算法最早是由Cover和Hart提出的一种分类算法例:求出距离:结合为:如何求距离?两个样本的距离可以通过如下公式计算,又叫欧式距离比如说,a(a1,a2,a3),b(b1,b2,b3)a1−b12a2−b22a3−b32。
2023-01-26 12:51:10
147
原创 机器学习之特征工程
特征工程是数据分析中最耗时间和精力的一部分工作。数据和特征决定了机器学习的上限,而模型和算法则是逼近这个上限。因此,特征工程就变得尤为重要了。特征工程的主要工作就是对特征的处理,包括数据的采集,数据预处理,特征选择,甚至降维技术等跟特征有关的工作。
2023-01-01 17:58:49
2383
原创 机器学习转换器与估计器
无监督学习( 英语: unSupervised learning),可以由输入数据中学到或建立-一个模型,并依此模式推测新的结果。 监督学习(英语: Supervised learning),可以由输入数据中学到或建立-一个模型,并依此模式推测新的结果。在sklearn中,估计器(estimator)是一个重要的角色,注:只要记住一点,离散型是区间内不可分,连续型是区间内可分。概念:分类是监督学习的一个核心问题,在监督学习中,,即判断是非,从两个类别中选择一个作为预测结果;
2023-01-01 17:45:05
190
原创 朴素贝叶斯、精确率与召回率、交叉验证
贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。而朴素朴素贝叶斯分类是贝叶斯分类中最简单,也是常见的一种分类方法。
2023-01-01 17:41:25
1280
原创 大数据:豆瓣电视剧爬虫反爬代理IP、spark清洗、flask框架做可视化
豆瓣电影大数据项目全步骤1.豆瓣爬虫:我开始写豆瓣电视剧爬虫时觉得很简单,但在实操时出现了封IP的情况,导致我苦恼了好久,现在终于写出来了 爬虫第一步:先拿一个网页来测试,...
2021-04-17 14:56:53
1848
4
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人