机器学习入门小结

最新推荐文章于 2024-08-14 12:00:04 发布

LXJSLK

最新推荐文章于 2024-08-14 12:00:04 发布

阅读量381

点赞数

分类专栏：算法

本文链接：https://blog.csdn.net/LXJSLK/article/details/127845341

版权

python

算法专栏收录该内容

3 篇文章 0 订阅

订阅专栏

kaggle上面的机器学习入门课程总结

首先是最基础的机器学习模型

决策树

我们在底部做预测的点叫做叶子。叶子处的分割和值将由数据决定

首先读入DataFrame的数据

melbourne_data = pd.read_csv(melbourne_file_path)

打印其列名

melbourne_data.columns

用dropna方法让NaN值视为不可用

melbourne_data.dropna(axis = 0)

取Price这一列作为输出的Y

y = melbourne_data.Price

选取特征，即输入X

melbourne_feature = ['Rooms', 'Bathroom', 'Landsize', 'Lattitude', 'Longtitude']

列表里的参数也是数据集里面的列名

X = melbourne_data[melbourne_feature ]

导入决策树模型

from sklearn.tree import DecisionTreeRegressor

将模型实例化

melbourne_model = DecisionTreeRegressor(random_state=1)

random_state指定一个数字可以得到一个确定性结果

调用模型的fit方法，拟合曲线

melbourne_model.fit(X,y)

验证生成的模型

计算MAE Mean Absolute Error

导入误差计算函数

from sklearn.metrics import mean_absolute_error

预测价格

predicted_home_prices = melbourne_model.predict(X)

实际价格和预测价格在误差函数的大小

mean_absolute_error(y, predicted_home_prices)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

LXJSLK

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
机器学习入门小结

学习机器学习的核心思想，并构建您的第一个模型。
复制链接

扫一扫

专栏目录

机器学习入门一

simon_zhou_test的博客

06-24

333

# 机器学习入门一安装环境省略。。。背景：这个数据集是基于 1990 年加州普查的数据。数据已经有点老（1990 年还能买一个湾区不错的房子），但是它有许多优点，利于学习，所以假设这个数据为最近的。你的第一个任务是利用加州普查数据，建立一个加州房价模型。这个数据包含每个街区组的人口、收入中位数、房价中位数等指标。街区组是美国调查局发布样本数据的最小地理单位（一个街区通常有 600 到...

机器学习入门（1）

WHJ226的博客

08-23

718

第二行中的数据，1和790相差是很大的，可能会影响我们权重的取值。该关系用一个称为r平方（r-squared）的值来衡量，其中0表示不相关，1表示100%相关。结果说明，重量2000千克的汽车，1.0升发动机，每行驶1公里，就会释放102.6克CO2。是数字，主要分为两种：离散数据（discrete）和连续数据（continuous）。从结果我们可以看到，x轴上的值集中在6，y轴上的值集中在12范围。我们使用前80%的数据作为训练，后20%的数据用于测试。类似于分类数据，但可以相互度量：A优于B的成绩。

1 条评论您还未登录，请先登录后发表或查看评论

【机器学习之路】十三种回归模型预测房价

热门推荐

认真写的博客

03-24

7万+

数据：https://www.kaggle.com/santibermejo/xgboost-for-house-price-prediction 这篇文章汇总了13个机器学习的回归算法，对比它们在同一个数据下的预测的效果。其实就是为了选模型的时候方便一点，一个一个试太麻烦了导入需要的库 import pandas as pd import numpy as np import matplo...

回归模型-kaggle房价预测

qq_29153321的博客

01-14

5746

房价回归模型 github链接：环境：python3 本文目的 1.机器学习的特征工程处理 2.各种回归模型的应用本项目完整源码地址：https://github.com/angeliababy/houseprice_regression 项目博客地址: https://blog.csdn.net/qq_29153321/article/details/103967670 数据准备数据来源是...

机器学习之分类决策树与回归决策树—基于python实现

qq_45856698的博客

05-02

3725

介绍分类决策树与回归决策树案例

机器学习03-(决策树：基本原理及集合算法、波士顿房屋价格数据分析与房价预测)

yegeli的博客

07-06

2705

机器学习-03机器学习-03决策树基本算法原理集合算法AdaBoost模型（正向激励）GBDT自助聚合随机森林 机器学习-03 决策树基本算法原理核心思想：相似的输入必会产生相似的输出。例如预测某人薪资：年龄：1-青年，2-中年，3-老年学历：1-本科，2-硕士，3-博士经历：1-出道，2-一般，3-老手，4-骨灰性别：1-男性，2-女性年龄学历经历性别 ==> 薪资 1 1 1 1 ==> 6000（低） 2 1 3 1 ==> 10000（中）

机器学习简介

weixin_44914455的博客

06-02

238

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、pandas是什么？二、使用步骤 1.引入库 2.读入数据总结前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习的基础内容。提示：以下是本篇文章正文内容，下面案例可供参考一、pandas是什么？示例：pandas 是基于NumPy 的一种工具，该工具是为了解决数..

python机器学习入门实战小结

01-27

本文来自jianshu，本文使用机器学习入门经典例子泰坦尼克号乘客生存预测来实际操作，将对应的算法应用在给出的数据集上进行预测的详细过程。随着人工智能的兴起，越来越多的机器学习爱好者加入了学习的行列，但是...

机器学习计算机视觉入门教程

07-08

### 机器学习计算机视觉入门教程知识点详解 #### 一、计算机视觉基础概念 - **定义**: 计算机视觉(Computer Vision, CV)是研究如何让计算机从图像或视频等多维数据中提取、处理、理解和获取信息的一门学科。它涉及...

南大出品 机器学习基础入门教程 机器学习导论第04章决策树共41页.pdf

07-18

### 机器学习基础入门教程——决策树 #### 决策树概述决策树是一种非常直观且易于理解的监督学习方法，适用于分类与回归任务。它通过构建一棵树形结构来进行决策，其中每个内部节点表示一个特征上的判断条件，每...

机器学习 Study Jam 第二季结课小测验 – Google1

08-03

【机器学习 Study Jam 第二季结课小测验 – Google1】这个小测验主要涵盖了 TensorFlow 基础知识和机器学习的一些基本概念。以下是针对这些知识点的详细说明： 1. **TensorFlow基础知识**： - **Python 基本操作**...

机器学习——决策树建模及预测

fwj_ntu的博客

03-12

1万+

本篇中将分4步介绍一个简单的决策树预测模型的构建过程，让你对建模过程有初步了解。 1. 选择数据集你的数据集中变量太多了，让人摸不着头脑，即便是打印出来也看不清楚。怎样才能把这些庞大的数据集简化为能看得懂的东西呢？在这篇中我们先依据直觉选择几个变量。稍后的篇章中将介绍如何利用统计类技巧优化变量。为了挑选一些特征变量，我们先要看一下数据集中有哪些字段。通过DataFrame的columns属性...

简单的机器学习程序_一文简单了解机器学习流程

weixin_39722375的博客

11-22

287

这篇文章来自Kaggle的一个数据科学的教程，其中的机器学习部分介绍了如何构建一个预测房价的机器学习模型，模型是如何工作的以及如何优化模型。本文使用的机器学习模型是决策树，使用 pandas 进行数据处理，使用 scikit learn 构建模型。1、决策树模型介绍使用决策树作为预测模型来预测样本的类别，这种决策树也称作分类树或回归树。在这些树的结构里，叶子节点给出类别而内部节点代表某个属性。在...

机器学习之挖掘melb_data.csv数据

weixin_34410662的博客

12-18

387

mel_data.csv是关于melb地区房屋的数据 mel_data.csv import pandas as pd melbourne_file_path = "E:\data\Melbourne Housing Snapshot\melb_data.csv" melbourne_data = pd.read_csv(melbourne_file_path) #读数据 melbourne_...

GraphRAG：复杂查询的知识图谱新框架

最新发布

YeJuliaLi的博客

08-14

571

微软最近发布了名为 GraphRAG（Graphs + Retrieval Augmented Generation）的创新 RAG 框架，这是一个将文本提取、语义网络分析，与大语言模型（LLM）的提示和总结功能结合在一起的端到端系统，用于深入理解文本数据集。在对私有数据中的复杂文本信息进行文档分析时，GrahRAG 使用 LLM 生成的知识图谱来大幅提高问答性能。这里的私有数据集是指 LLM 没...

网络安全入门教程（非常详细）从零基础入门到精通，看完这一篇就够了。

2401_84466359的博客

08-12

518

这个方向更符合于大部分人对“黑客”的认知，他们能够黑手机、黑电脑、黑网站、黑服务器、黑内网，万物皆可黑（当然是要有授权的，不然进橘子我可不管），这个方向初期比较容易入门一些，掌握一些基本技术，拿起各种现成的工具就可以开黑了。是一种面向对象、直译式电脑编程语言，具有近二十年的发展历史，成熟且稳定。压箱底的好资料，全面地介绍网络安全的基础理论，包括逆向、八层网络防御、汇编语言、白帽子web安全、密码学、网络安全协议等，将基础理论和主流工具的应用实践紧密结合，有利于读者理解各种主流工具背后的实现机制。

importlib库介绍

m0_51579041的博客

08-14

193

importlib

Java读写EM4305卡、将4305卡制做成4100ID卡

zhangjin7422的专栏

08-14

367

Java读写em4305低频RFID源码，支持将EM4305卡配置成4100ID卡

【Markdown】Markdown 中的语言简称

EleganceJiaBao的博客

08-12

927

以下是常见编程语言、脚本语言、标记语言等在 Markdown 中的语言简称以及相应的示例：

谷歌机器学习Study Jam第二季结课小测验

这些题目覆盖了机器学习入门阶段的关键概念，包括基础数学知识、编程语言基础、深度学习框架的理解以及实际模型的构建和训练流程。通过这样的小测验，参与者可以检验自己对TensorFlow和机器学习基础的掌握程度，...