目录
本内容主要是《python数据分析与数据化运营》的学习笔记
1、案例概述
案例场景:每个公司都有一定的促销费用,促销费用可以带来销售量的显著提升,当给出一定的促销费用时,预测会带来多大的商品销售量?
原始数据如下:
2、案例过程
#一、读取数据
import pandas as pd #pandas包用来将数据读取成DataFrame格式
raw_data = pd.read_csv('data.txt')
#用pandas自带的方法读取csv,由于程序文件和数据文件处于同一目录下,因此无须制定路径
##二、数据预处理
#2.1 设置建模用的x和y,x,y=df[['列名1']],df[['列名2']]
x,y = raw_data[['money']],raw_data[['amount']]
#2.2 拆分训练集和测试集
#2.2-1 按照设置的num数拆分训练集和测试集
#设置一个用于确认数据交叉检验比例的阈值条件,默认是用70%的数据做训练
#raw_data.shape[0]是获取该数据集的行数,
num = int(raw_data.shape[0]*