自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 机器学习sklearn k-近邻算法

定义:如果一个样本在特征空间中的,则该样本也属于这个类别。来源: KNN算法最早是由Cover和Hart提出的一种分类算法例:求出距离:结合为:如何求距离?两个样本的距离可以通过如下公式计算,又叫欧式距离比如说,a(a1,a2,a3),b(b1,b2,b3)a1−b12a2−b22a3−b32​。

2023-01-26 12:51:10 147

原创 机器学习之特征工程

特征工程是数据分析中最耗时间和精力的一部分工作。数据和特征决定了机器学习的上限,而模型和算法则是逼近这个上限。因此,特征工程就变得尤为重要了。特征工程的主要工作就是对特征的处理,包括数据的采集,数据预处理,特征选择,甚至降维技术等跟特征有关的工作。

2023-01-01 17:58:49 2383

原创 机器学习转换器与估计器

​ 无监督学习( 英语: unSupervised learning),可以由输入数据中学到或建立-一个模型,并依此模式推测新的结果。​ 监督学习(英语: Supervised learning),可以由输入数据中学到或建立-一个模型,并依此模式推测新的结果。在sklearn中,估计器(estimator)是一个重要的角色,注:只要记住一点,离散型是区间内不可分,连续型是区间内可分。概念:分类是监督学习的一个核心问题,在监督学习中,,即判断是非,从两个类别中选择一个作为预测结果;

2023-01-01 17:45:05 190

原创 朴素贝叶斯、精确率与召回率、交叉验证

贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。而朴素朴素贝叶斯分类是贝叶斯分类中最简单,也是常见的一种分类方法。

2023-01-01 17:41:25 1280

原创 HA高可用集群文档搭建

HADOOP的HA高可用集群的搭建流程以及初始化启动流程

2023-01-01 15:25:26 361 4

原创 大数据:豆瓣电视剧爬虫反爬代理IP、spark清洗、flask框架做可视化

豆瓣电影大数据项目全步骤1.豆瓣爬虫:我开始写豆瓣电视剧爬虫时觉得很简单,但在实操时出现了封IP的情况,导致我苦恼了好久,现在终于写出来了 爬虫第一步:先拿一个网页来测试,...

2021-04-17 14:56:53 1848 4

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除