数据分析面试题
1.一家超市的顾客数据,将数据可视化并分析销售额和年龄、收入的关系并给出营销建议
年龄 | 收入 | 销售额 |
---|---|---|
34 | 350 | 123 |
40 | 450 | 114 |
37 | 169 | 135 |
30 | 189 | 139 |
44 | 183 | 117 |
36 | 80 | 121 |
32 | 166 | 133 |
26 | 120 | 140 |
32 | 75 | 133 |
36 | 40 | 133 |
答案:
import matplotlib.pyplot as plt
# 年龄
age = [34,40,37,30,44,36,32,26,32,36]
# 收入
income = [350,450,169,189,183,80,166,120,75,40]
# 销售额
sales = [123,114,135,139,117,121,133,140,133,133]
# 年龄,销售额 散点图
plt.scatter(age,sales)
plt.show()
# 收入,销售额 散点图
plt.scatter(income,sales)
<matplotlib.collections.PathCollection at 0x7e87550>
可视化结论:
- 顾客年龄和销售额负相关,年龄越大销售额越低
- 顾客收入和销售额也呈负相关,收入越高销售额越低
建议:
- 营销针对人群应是一般收入100-200之间,年龄20-37之间的人群,这样营销效果更好
2.使用原生Python代码和Numpy并行计算分别求解下面的y值
x1 = [1,2,3,4,5]
x2 = [3,5,2,9,10]
y = x12 + x23
求y值:原生Python实现
x1 = [