《动手学数据分析》第三章学习笔记

最新推荐文章于 2024-07-25 22:24:14 发布

sxccc_

最新推荐文章于 2024-07-25 22:24:14 发布

阅读量319

点赞数

文章标签：数据分析学习机器学习

本文链接：https://blog.csdn.net/sxccc_/article/details/127001801

版权

《动手学数据分析》第三章学习笔记

模型搭建

one-hot的基本思想：将离散型特征的每一种取值都看成一种状态，若你的这一特征中有N个不相同的取值，那么我们就可以将该特征抽象成N种不同的状态，one-hot编码保证了每一个取值只会使得一种状态处于“激活态”，也就是说这N种状态中只有一个状态位值为1，其他状态位都是0。

pd.get_dummies( *data*, *prefix=None*, *prefix_sep='_'*, *dummy_na=False*, *columns=None*, *sparse=False*, *drop_first=False*, *dtype=None)*

创建基于线性模型的分类模型（逻辑回归）
```
lr = LogisticRegression()
lr.fit(X_train, y_train)
```
创建基于树的分类模型（决策树、随机森林）
```
rfc = RandomForestClassifier()
rfc.fit(X_train, y_train)
```
查看模型的参数，并更改参数值，观察模型变化

模型评估

（一）交叉验证

print("Average cross-validation score: {:.2f}".format(scores.mean()))

（二）混淆矩阵

confusion_matrix(y_train, pred)

精确率、召回率以及f1-score

print(classification_report(y_train, pred))

（三）ROC曲线

sklearn.metrics有roc_curve, auc两个函数，ROC曲线上的点主要就是通过这两个函数计算出来的。

fpr, tpr, thresholds  =  roc_curve(y_test, scores) 
roc_auc =auc(fpr, tpr)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

sxccc_

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
《动手学数据分析》第三章学习笔记

笔记
复制链接

扫一扫

自己动手写CPU 第八章学习笔记

06-12

在“自己动手写CPU 第八章学习笔记”中，我们主要探讨了CPU设计中的关键概念和技术，这章可能涵盖了流水线、中断系统、内存管理以及输入/输出接口等多个主题。以下是对这些知识点的详细说明： 1. **流水线技术**：...

利用Python进行数据分析学习笔记以及自己寻找数据集做的练习

08-16

本资源“利用Python进行数据分析学习笔记以及自己寻找数据集做的练习”旨在帮助你掌握如何用Python进行高效的数据处理、分析和可视化。首先，你需要了解Python的基础语法，包括变量、控制流（如if语句和for循环）...

参与评论您还未登录，请先登录后发表或查看评论

《动手学数据分析》第二章学习笔记

sxccc_的博客

09-18

学习笔记

动手学数据分析第三章笔记

z20000812的博客

03-21

1201

然后，说说分层抽样的好处。：混淆矩阵的每一列表示预测类别，每一列的总数表示预测为该类别的数据的数目；每一行表示数据的真实归属类别，每一行的数据总数表示该类别的数据实例的数目；：线性模型的输出是实数，不一定在区间[0,1]内，但分类任务需要概率测度。：混淆矩阵是一个N×N的矩阵，其中N表示分类标签的个数。：线性回归模型可以通过引入一个单调可微的函数来连接分类任务的真实标签（类别）和线性回归模型的预测值。总之，如果数据集本身已经足够随机，或者数据集非常大且不需要全部数据进行实验，那么就不需要进行随机选取。

《动手学深度学习》学习笔记第8章循环神经网络

weixin_42046845的博客

01-12

1144

笔记是从第四章开始，前面三章为基础知识，有需要的可以自己去看看关于本系列笔记：书里为了让读者更好的理解，有大篇幅的描述性的文字，内容很多，笔记只保留主要内容，同时也是对之前知识的查漏补缺

动手学数据分析第二章第四节笔记

z20000812的博客

03-18

629

显式创建figure和axes，在上面调用绘图方法，也被称为OO模式（object-oriented style)三. 数据可视化还可以学习pyecharts，bokeh，seaborn等包的用法。依赖pyplot自动创建figure和axes，并绘图。是常用的Pandas函数。一.matplotlib提供了两种最常用的绘图接口。二. 当处理数据时，

[通俗易懂]《动手学强化学习》学习笔记1-第1章初探强化学习

weixin_56760882的博客

04-07

957

参考：《动手学强化学习》作者：张伟楠，沈键，俞勇动手学强化学习网页版动手学强化学习 github代码动手学强化学习视频强化学习入门这一篇就够了！！！万字长文（讲的很好）我做出的决策：选择了强化学习作为研究方向。强化学习是人工智能的未来。未来智能系统需要能够在不接受持续监督的情况下自主学习，而强化学习正是其中的最佳代表之一。我们知道，机器学习分为无监督学习，（有）监督学习，强化学习，迁移学习和深度学习等。（各有说法）无监督学习分析数据流，发现模式并做出预测，无需任何其他指导。解决聚类问题。

Matlab基础数据分析学习笔记.md

08-31

第三部分讲解了数据可视化方法,包括折线图、散点图、柱状图的绘制,并给出了相应的代码实例。整体内容全面系统地覆盖了MATLAB的数据处理流程。适合人群: 需要学习MATLAB数据处理方法的科研人员、工程技术人员以及...

Python基础学习整理笔记

08-21

6. **Python学习笔记**和《笨办法学Python》提供了不同角度的学习路径，前者可能包含更深入的实践案例，后者则以项目驱动的方式引导初学者动手实践。 7. **简明Python教程**和《Learning Python英文版》是全面且...

数据分析师进阶之路-python学习认证.docx

06-19

计算机毕业设计Django+Vue.js知识图谱音乐推荐系统音乐爬虫可视化音乐数据分析 大数据毕设大数据毕业设计 机器学习 深度学习人工智能

从业计算机毕业设计10年，打算用一年时间分享10年毕设经验！

07-23

502

计算机毕业设计Django+Vue.js知识图谱音乐推荐系统音乐爬虫可视化音乐数据分析 大数据毕设大数据毕业设计 机器学习 深度学习人工智能

【CPS出版】2024年智能计算与数据分析国际学术会议（ICDA 2024，9月6日-8）

Jurio的博客

07-25

841

ICDA 2024，2024年智能计算与数据分析国际学术会议，2024 International Conference on Intelligent Computing and Data Analytics

每天一个数据分析题（四百四十八）- 企业数据

shiguangre的博客

07-24

344

内容涵盖Python，SQL，统计学，数据分析理论，深度学习，可视化，机器学习，Spark八个方向的专项练习题库，数据分析从业者刷题必备神器！业务数据中因为某些原因可能存在异常值，现要通过可视化的方式查找某字段数据中的异常值，优先使用以下哪种图形？A. 箱形图。B. 甘特图。C. 雷达图。D. K线图。

学习笔记：《用Python进行数据分析》之Python基础

小火柴

07-24

929

当在Python中创建变量（或名字），你就在等号右边创建了一个对这个变量的引用。考虑一个整数列表，假设将a赋值给一个新变量b，在有些方法中，这个赋值会将数据[1, 2, 3]也复制。在Python中，a和b实际上是同一个对象，即原有列表[1, 2, 3]。Python中的大多数对象，比如列表、字典、NumPy数组，和用户定义的类型（类），都是可变的，意味着这些对象或包含的值可以被修改。这段脚本运行在空的命名空间（没有import和其它定义的变量），因此结果和普通的运行方式。在变量前后使用问号？

Linux：基础命令学习

qq_55038440的博客

07-20

1510

实例：-F根据文件类型在列出的文件名称后加一符号。实例： -R 递归显示目录中的所有文件和子目录。. 开头的隐藏文件也会列出。可执行文件则加 "*"，用于显示目录文件信息。

AvaloniaUI的学习