机器学习

最新推荐文章于 2021-11-29 12:22:20 发布

zhuidanGreen

最新推荐文章于 2021-11-29 12:22:20 发布

阅读量305

点赞数 1

本文链接：https://blog.csdn.net/zhuidangreen/article/details/80689856

版权

线性回归

import numpy as np

import pandas as pd

from sklearn.model_selection import train_test_split

from sklearn import linear_model

from sklearn import metrics

data = pd.read_csv('Advertising.csv')

x = data[['TV', 'Radio', 'Newspaper']]

y = data['Sales']

x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.1,random_state=1)

reg=linear_model.LinearRegression（）

reg.fit(x_train,y_train)

metrics.mean_squared_error(y_test,y_pred)

逻辑回归

data=pd.read_csv('iris.data',header=None)

data[4]=pd.Categorical(data[4]).codes

x,y=np.split(data.values,(4,),axis=1)

cls=linear_model.LogisticRegression()

x_train,x_test,y_train,y_test=train_test_split(x,y,test_size=0.1,random_state=0)

cls.fit(x_train,y_train)

y_pred=cls.predict(x_test)

y_hat_prob = lr.predict_proba(x) #概率

print（‘准确度：%.2f%%’ % (100*np.mean(y_pred==y_test))

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

zhuidanGreen

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

机器学习知识点全面总结

专注大数据与人工智能技术分享，欢迎私信加群互相学习！

04-12

13万+

机器学习按照模型类型分为监督学习模型、无监督学习模型和概率模型三大类,文章对十大机器学习算法进行详细介绍并阐述机器学习其他概念问题，可作为机器学习初学者学习使用。

Advertising.csv

02-04

线性回归数据集---广告数据集三个参数，一个输出线性回归数据集---广告数据集三个参数，一个输出线性回归数据集---广告数据集三个参数，一个输出

参与评论您还未登录，请先登录后发表或查看评论

AI: 机器学习必须懂的几个术语：Label、Feature、Model...

热门推荐

HowieXue 薛永浩的博客

02-11

7万+

标签 Lable 标签：所预测的东东实际是什么（可理解为结论），如线性回归中的 y 变量，如分类问题中图片中是猫是狗（或图片中狗的种类）、房子未来的价格、音频中的单词等等任何事物，都属于Lable。（如一组图片，已经表明了哪些是狗，哪些是猫，这里Lable就是分类问题中每一个类）特征 Feature 特征是事物固有属性，可理解为做出某个判断的依据，如人的特征有长相、衣服、行为动作等等，一个事...

少标签数据学习（Learning with Few Labeled Data）

05-22

人类的视觉系统证明，用极少的样本就可以学习新的类别;人类不需要一百万个样本就能学会区分野外的有毒蘑菇和可食用蘑菇。可以说，这种能力来自于看到了数百万个其他类别，并将学习到的表现形式转化为新的类别。

机器学习通俗易懂系列之trainingData

就俩字，咱们要做精通，不做熟悉

07-23

5286

有监督学习的样本，在尽量少人工标注的情况下，利用各种半监督、无监督算法进行样本标记；在有了labeled data之后，根据测试集表现，调整labeled data比例/清洗label，生成优质训练集

机器学习学习笔记(day02)

qq_42433311的博客

11-29

2958

机器学习分类、数据集划分、转换器与估计器、KNN(K-近邻)、朴素贝叶斯、精确率与召回率、交叉验证与网格搜索、决策树、随机森林(集成学习)

机器学习考试题目及答案1

08-08

机器学习是一种人工智能领域的核心方法，它允许计算机程序通过经验学习并改进其性能。根据Tom Mitchell的定义，机器学习涉及的任务T、性能度量P和经验E，其中程序在任务上的性能随着经验的增加而提高。在实际应用中...

机器学习期末复习题.pdf

01-06

机器学习期末复习题库 机器学习是人工智能领域中的一门重要学科，涉及到各种算法和技术，以下是机器学习期末复习题库的详细解析：监督学习和无监督学习监督学习是指在有标签的数据集上训练模型，以便在未来的...

机器学习南瓜书.pdf

最新发布

04-15

南瓜书旨在对西瓜书里比较难理解的公式加以解析

周志华《机器学习》学习笔记（大全）

03-06

本文为周志华《机器学习》的学习笔记，记录了本人在学习这本书的过程中的理解思路以及一些有助于消化书内容的拓展知识，笔记中参考了许多网上的大牛经典博客以及李航《统计学习》的内容，向前辈们和知识致敬！

python实现鸢尾花决策树_python实现决策树、随机森林的简单原理

weixin_39886469的博客

12-05

1021

本文申明：此文为学习记录过程，中间多处引用大师讲义和内容。一、概念决策树(Decision Tree)是一种简单但是广泛使用的分类器。通过训练数据构建决策树，可以高效的对未知的数据进行分类。决策数有两大优点：1)决策树模型可以读性好，具有描述性，有助于人工分析；2)效率高，决策树只需要一次构建，反复使用，每一次预测的最大计算次数不超过决策树的深度。看了一遍概念后，我们先从一个简单的案例开始，如下图...

机器学习：线性回归

奔腾游子

04-14

760

机器学习入门：线性回归 1、实验描述本实验中提供一份关于产品广告费用与对应产品销量的数据文件Advertising.csv文件，利用此文件建立线性模型、训练模型、用模型做预测分析。实验时长：45分钟主要步骤：加载csv文件获得标签和特征数据展示标签和特征的关系图切分数据集创建模型用模型做预测模型评估 2、实验环境虚拟机数量：1 系统版本：CentOS 7.5 scikit-learn版本： 0.19.2 pandas版本：

pd.Categorical 用法

不死彡邪神的博客

05-29

9081

http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Categorical.html 网址class pandas.Categorical（values，categories = None，ordered = None，dtype = None，fastpath = False ）[source]代表经典的R / S +时...

04-3 pandas 中 pd.Categorical用法

DayDayUp

11-01

6483

pandas.Categorical（values，categories = None，ordered = None，dtype = None，fastpath = False ）[source] 表示经典R / S-plus方式的分类变量分类只能采用有限的，通常是固定数量的可能值（类别）。与统计分类变量相比，分类可能具有顺序，但数值运算（加法，除法，…）是不可能的。分类的所有值都在类别或np...

#拆分训练集和测试集 x_train, x_test, y_train, y_test = train_test_split 参数都是什么意思呢？

HWP

11-30

1万+

#拆分训练集和测试集 x_train,x_test,y_train,y_test=train_test_split( x,y,test_size=0.2,random_state=42) 完整模板： train_X,test_X,train_y,test_y = train_test_split(train_data,train_target,test_size=0.3,random_state=5) 参数解释： train_data：待划分样本数据 train_...

回归算法（python code）----------机器学习系列（一）

河南骏的博客

06-19

6433

回归算法---code

决策树与随机森立案（python code）---------------------------机器学习系列（二）

河南骏的博客

06-27

1515

前面一篇大致讲解了一下有关决策树与随机森林的理论部分，这一篇我们就来电实际的，讲一下python怎么实现决策树与随机森林的，这部分的code有一点简单，应该可以更好的理解这个算法。首先是模块的导入，涉及的模块有 import numpy as np import matplotlib.pyplot as plt import

train_test_split（），随机划分训练集和测试集的函数

jiushinayang的博客

07-18

4万+

1. 官网文档： http://scikit-learn.org/stable/modules/generated/sklearn.model_selection.train_test_split.html#sklearn.model_selection.train_test_split 2. train_test_split()是sklearn包的model_selection模块中提供的...

机器学习实战指南

《Machine Learning in Action》是由Peter Harrington撰写的一本实践导向的机器学习书籍，由Manning出版社出版。这本书的独特之处在于它不专注于理论，而是侧重于通过实际案例来教授机器学习的概念和技术。作者旨在...