Python机器学习原理与算法实现中绘制散点图和线图的操作

作为对数据进行预处理的重要工具之一,散点图(Scatter Diagram)深受专家、学者们的喜爱。散点图的简要定义就是点在直角坐标系平面上的分布图。研究者对数据制作散点图的主要出发点是通过绘制该图来观察某变量随另一变量变化的大致趋势,据此可以探索数据之间的关联关系,甚至选择合适的函数对数据点进行拟合。

散点图的绘制函数是plt.scatter() 和sns.scatterplot() 。其中plt.scatter() 的具体函数形式为:

matplotlib.pyplot.scatter(x, y, s=None, c=None, marker=None, cmap=None, norm=None, vmin=None, vmax=None, alpha=None, linewidths=None, verts=None, edgecolors=None, *, data=None, **kwargs)

函数中常用的参数说明如下:

  1. x,y分别表示用于绘制散点图的x轴和y轴的数据点。
  2. s用于控制散点的大小。
  3. c即color,用于设置散点标记的颜色,默认是蓝色(b),如果是红色,则为'r'。
  4. marker用于设置散点标记的样式,默认为'o'。
  5. linewidth用于设置标记点的长度。

线图与散点图的区别就是用一条线来替代散点标志,这样做可以更加清晰直观地看出数据走势,但却无法观察到每个散点的准确定位。从用途上看,线图常用于时间序列分析的数据预处理,用来观察变量随时间的变化趋势。此外,线图可以同时反映多个变量随时间的变化情况,所以线图的应用范围也非常广泛。

以绘制invest和profit的散点图和线图为例,代码如下(注意需要全部选中这些代码整体运行):

plt.figure(figsize=(12,6)) # 设置图形的宽为12英寸,图形的高为6英寸

plt.subplot(1,3,1) # 指定作图位置。在同一画面创建1行3列个图形位置,首先在从左到右的第一个位置作图

sns.scatterplot(data=data, x="invest", y="profit", hue="invest", alpha=0.6) # 绘制invest和profit的散点图,使用的数据集为data,x轴为invest,y轴为profit,参数hue的作用就是在图像中将输出的散点图按照hue指定的变量(invest)的颜色种类进行区分,alpha为散点的透明度,取值为0~1

plt.title("Scatter plot") # 将散点图的标题设置为Scatter plot

plt.subplot(1,3,2) # 指定作图位置

sns.lineplot(data=data, x="invest", y="profit") # 绘制invest和profit的线图

plt.title("Line plot of invest, profit") # 将标题设置为Line plot of invest, profit

plt.subplot(1,3,3) # 指定作图位置

sns.lineplot(data=data) # 绘制全部变量的线图

plt.title('Line Plot') # 将标题设置为Line Plot,运行结果如图4.9所示

图中从左到右分别展示的是变量invest和profit的散点图、变量invest和profit的线图、数据集中所有变量的线图。

以上内容节选自《Python机器学习原理与算法实现》(杨维忠 张甜 著 2023年2月新书 清华大学出版社)一书。本书已正式出版上市,当当、京东、淘宝等平台热销中,搜索书名即可。

针对数据分析或机器学习推荐两本入门级的图书:《Python机器学习原理与算法实现》(杨维忠 张甜 著 2023年2月新书 清华大学出版社)《Python数据科学应用从入门到精通》(张甜 杨维忠 著 2023年11月新书 清华大学出版社)。这两本书的特色是在数据分析、机器学习各种算法的介绍方面通俗易懂,较少涉及数学推导,对数学基础要求相对不高,在python代码方面讲的很细致,看了以后根据自身需要选取算法、优化代码、科学调参。都有配套免费提供的源代码、数据文件和视频讲解,也有PPT、思维导图、习题等。

为什么说这两本书值得?首先说《Python机器学习原理与算法实现》(杨维忠 张甜 著 2023年2月新书 清华大学出版社),内容非常详实,包含了Python和机器学习,相当于一次获得了两本书。在讲解各类机器学习算法时,逐一详解用到的各种Python代码,针对每行代码均有恰当注释(这一点基本上是大多数书目做不到的)。这本书在出版之前曾开发成9次系列课程,在某股份制银行全行范围类开展培训,490人跟随杨维忠老师上课学习(课程限报490人),培训完成后课程在知鸟平台上回放超过3万人次。很多银行员工通过这些学习一下子就学会了Python,并且用于工作中开展数据分析、机器学习、数据可视化等,这本书也被多家商业银行选做数字化人才培训教材,成为银行员工的一本网红书。

《Python数据科学应用从入门到精通》一书,旨在教会读者实现全流程的数据分析,并且相对《Python机器学习原理与算法实现》一书增加了很多概念性、科普性的内容,进一步降低了学习难度。国务院发展研究中心创新发展研究部第二研究室主任杨超 ,山东大学经济学院金融系党支部书记、副主任、副教授、硕士生导师张博,山东管理学院信息工程学院院长 袁锋 教授、硕士生导师,山东大学经济学院刘一鸣副研究员、硕士生导师,得厚投资合伙人张伟民等一众大牛联袂推荐。书中全是干活,买这一本书相当于一下子得到了5本书(Python基础、数据清洗、特征工程、数据可视化、数据挖掘与建模),而且入门超级简单,不需要编程基础,也不需要过多数学推导,非常适用于零基础学生。全书内容共分13章。其中第1章为数据科学应用概述,第2章讲解Python的入门基础知识,第3章讲解数据清洗。第4~6章介绍特征工程,包括特征选择、特征处理、特征提取。第7章介绍数据可视化。第8~13章介绍6种数据挖掘与建模方法,分别为线性回归、Logistic回归、决策树、随机森林、神经网络、RFM分析。从数据科学应用和Python的入门,再到数据清洗与特征工程,最终完成数据挖掘与建模或数据可视化,从而可以为读者提供“从拿到数据开始,一直到构建形成最终模型或可视化报告成果”的一站式、全流程指导。

两本书随书赠送的学习资料也很多,包括全部的源代码、PPT、思维导图,还有10小时以上的讲解视频,每一章后面还有练习题及参考答案,还有学习群,相对于只看网络上的视频,一方面更加系统、高效,另一方面照着书一步步操作学起来也事半功倍。全网热销中,当当、京东等平台搜索“Python机器学习 杨维忠”“Python数据科学 杨维忠”即可。

《Python机器学习原理与算法实现》(杨维忠、张甜著,2023年2月,清华大学出版社),适用于学习Python/机器学习

《Python数据科学应用从入门到精通》(张甜 杨维忠 著 2023年11月新书 清华大学出版社)适用于学习数据分析、数据科学、数据可视化等。

创作不易,恳请多多点赞,感谢您的支持!也期待大家多多关注我,让我共同学习数据分析知识。

### 回答1: 对于机器学习的预测结果可视化,可以使用Python的Matplotlib和Seaborn等库进行绘图。 下面以一个简单的线性回归模型为例,来展示如何可视化它的预测结果: ```python import numpy as np import matplotlib.pyplot as plt import seaborn as sns # 生成一些随机数据 X = 2 * np.random.rand(100, 1) y = 4 + 3 * X + np.random.randn(100, 1) # 将数据可视化 sns.scatterplot(x=X.ravel(), y=y.ravel()) plt.xlabel('X') plt.ylabel('y') plt.show() # 训练线性回归模型 from sklearn.linear_model import LinearRegression lin_reg = LinearRegression() lin_reg.fit(X, y) # 对新数据进行预测 X_new = np.array([[0], [2]]) y_pred = lin_reg.predict(X_new) # 将预测结果可视化 sns.scatterplot(x=X.ravel(), y=y.ravel()) sns.lineplot(x=X_new.ravel(), y=y_pred.ravel(), color='red') plt.xlabel('X') plt.ylabel('y') plt.show() ``` 上述代码,首先生成了一些随机数据并将其可视化。然后用线性回归模型对数据进行训练,并对新数据进行预测。最后将预测结果可视化,其蓝色点表示原始数据,红色线表示预测结果。 通过这样的可视化,我们可以更加直观地了解模型的预测效果,从而更好地进行模型的调整和优化。 ### 回答2: Python机器学习的predict结果可视化,可以通过使用各种图表和图形库来实现。其一种常用的库是matplotlib。 首先,我们可以使用matplotlib库散点图来可视化预测结果。我们可以将样本点在二维平面上以不同的颜色和形状绘制出来,然后用预测结果对应的颜色和形状来标记。这样可以直观地展示预测结果与真实结果之间的关系。 另一种常见的可视化方法是使用matplotlib的柱状图或折线图来表示预测结果与真实结果之间的差异。可以将预测结果和真实结果按照某种标准进行分组,然后用柱状图或折线图表示每个组的平均预测结果和真实结果。通过对比不同组之间的差异,可以更加直观地了解模型的预测能力。 此外,还可以使用matplotlib的热力图来展示预测结果的概率分布。热力图可以将不同预测结果的概率用颜色深浅来表示,从而可以观察到不同预测结果的概率分布情况。 除了matplotlib,还有其他一些可视化库也可以用来展示机器学习的预测结果,例如seaborn和plotly。这些库提供了更多的图表和图形类型,可以根据具体需求选择合适的库进行可视化。 总结起来,Python机器学习的predict结果可视化可以通过使用matplotlib等库来实现,可以利用散点图、柱状图、折线图、热力图等图表来展示预测结果与真实结果之间的关系、差异和概率分布。 ### 回答3: 在Python,我们可以使用不同的库和工具来对机器学习模型的predict结果进行可视化。下面是几种常见的可视化方法: 1. Matplotlib库:Matplotlib是Python最常用的绘图库,可以用于绘制各种类型的图表,包括直方图、散点图线图等。我们可以将模型的预测结果与真实结果进行对比,使用Matplotlib创建直方图或散点图来显示它们之间的差异。 2. Seaborn库:Seaborn是基于Matplotlib的高级数据可视化库,它提供了更加美观和专业的统计图表,同时也更加简单易用。我们可以使用Seaborn绘制误差线图、箱线图等,以展示预测结果的分布情况或者模型的性能。 3. Plotly库:Plotly是一种交互式数据可视化工具,可以创建美观且具有动态性的图表。我们可以使用Plotly来绘制预测结果的3D散点图或表面图,以展示数据的分布和模型的预测情况。 4. TensorFlow的TensorBoard:如果我们使用的是TensorFlow来构建和训练机器学习模型,可以使用TensorBoard来可视化predict结果。TensorBoard为我们提供了丰富的可视化工具,包括绘制训练和验证数据的曲线、查看模型的架构和参数分布等。 无论选择哪种方法,可视化机器学习模型的predict结果可以帮助我们更好地理解模型的性能、数据的分布以及预测的准确性。通过直观的可视化图表,我们能够更好地分析和解释模型的结果,并提供对改进模型和优化算法的有价值的见解。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

数据科学作家

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值