作者 / 来源:林骥(ID:linjiwx)
01
散点图就像一扇窗,打开它,并仔细观察,能让我们看见更多有价值的信息。
比如说,假设表格中有 10000 个客户年龄和消费金额的数据:
我们可以计算每一个年龄对应的人均消费金额,比如说,所有 20 岁客户的平均消费金额约为 1383.69 元,然后我们可以画出一张散点图:
从图中可以看出,客户的年龄与人均消费金额有很强的相关性,其中应用了线性回归算法,得到一条拟合的直线,并用公式表示出来,R2接近于 1 ,代表算法拟合的效果很好。
02
接下来,我们看看具体实现的步骤。
首先,导入所需的库,并设置中文字体和定义颜色等。# 导入所需的库
import numpy as np
import pandas as pd
import matplotlib as mpl
import matplotlib.pyplot as plt
from s