![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
sklearn
阳阳yyx
这个作者很懒,什么都没留下…
展开
-
Python: sklearn库中数据预处理函数fit_transform()和transform()的区别
文章目录Python: sklearn库中数据预处理函数fit_transform()和transform()的区别Python: sklearn库中数据预处理函数fit_transform()和transform()的区别最近学习Udacity的机器学习项目,在敲code的时候,发现涉及到sklearn数据预处理的两个函数:fit_transform()和transform(),这两个函数对...原创 2019-03-22 11:00:21 · 4177 阅读 · 0 评论 -
机器学习工程师 — Udacity 波士顿房价预测
机器学习工程师纳米学位模型评价与验证项目 1: 预测波士顿房价欢迎来到预测波士顿房价项目!在此文件中,我们已经提供了一些示例代码,但你还需要完善更多功能才能让项目成功运行。除非有明确要求,你无需修改任何已给出的代码。习题的标题为编程练习。每一部分都会有详细的指导,需要实现的部分也会在注释中以TODO标出。请仔细阅读所有的提示!除了实现代码外,你还必须回答一些问题。请仔细阅读每个问题,并且在...原创 2019-03-26 14:27:49 · 1123 阅读 · 1 评论 -
机器学习:特征工程
文章目录特征工程常用的两种数据类型特征归一化数值型特征类别型特征序号编码的python实现独热编码的python实现特征工程特征工程,顾名思义,是对原始数据进行一系列工程处理,将其提炼为特征,作为输入供算法和模型使用。从本质上来讲,特征工程是一个表示和展现数据的过程。在实际工作中,特征工程旨在去除原始数据中的杂质和冗余,设计更高效的特征以刻画求解的问题与预测模型之间的关系。常用的两种数据...原创 2019-04-02 15:58:42 · 468 阅读 · 0 评论 -
机器学习工程师 — Udacity 为CharityML寻找捐献者
机器学习纳米学位监督学习项目2: 为CharityML寻找捐献者欢迎来到机器学习工程师纳米学位的第二个项目!在此文件中,有些示例代码已经提供给你,但你还需要实现更多的功能让项目成功运行。除非有明确要求,你无须修改任何已给出的代码。以**‘练习’**开始的标题表示接下来的代码部分中有你必须要实现的功能。每一部分都会有详细的指导,需要实现的部分也会在注释中以’TODO’标出。请仔细阅读所有的提示...原创 2019-05-04 14:26:13 · 1187 阅读 · 0 评论 -
机器学习工程师 — Udacity 电影评分的 k 均值聚类
电影评分的 k 均值聚类假设你是 Netflix 的一名数据分析师,你想要根据用户对不同电影的评分研究用户在电影品位上的相似和不同之处。了解这些评分对用户电影推荐系统有帮助吗?我们来研究下这方面的数据。我们将使用的数据来自精彩的 MovieLens 用户评分数据集。我们稍后将在 notebook 中查看每个电影评分,先看看不同类型之间的评分比较情况。数据集概述该数据集有两个文件。我们将这两...原创 2019-05-13 20:05:31 · 3631 阅读 · 4 评论 -
机器学习工程师 — Udacity 构建垃圾邮件分类
我们的任务垃圾邮件检测是机器学习在现今互联网领域的主要应用之一。几乎所有大型电子邮箱服务提供商都内置了垃圾邮件检测系统,能够自动将此类邮件分类为“垃圾邮件”。在此项目中,我们将使用朴素贝叶斯算法创建一个模型,该模型会通过我们对模型的训练将信息数据集分类为垃圾信息或非垃圾信息。对垃圾文本信息进行大致了解十分重要。通常它们都包含“免费”、“赢取”、“获奖者”、“现金”、“奖品”等字眼,因为这些它们...原创 2019-03-30 18:38:27 · 990 阅读 · 0 评论 -
机器学习工程师 — Udacity 创建客户细分
机器学习纳米学位非监督学习项目 3: 创建用户分类开始在这个项目中,你将分析一个数据集的内在结构,这个数据集包含很多客户真对不同类型产品的年度采购额(用金额表示)。这个项目的任务之一是如何最好地描述一个批发商不同种类顾客之间的差异。这样做将能够使得批发商能够更好的组织他们的物流服务以满足每个客户的需求。这个项目的数据集能够在UCI机器学习信息库中找到.因为这个项目的目的,分析将不会包括 ...原创 2019-05-12 14:15:32 · 8025 阅读 · 0 评论