- 博客(10)
- 收藏
- 关注
原创 Python数据处理
data=pd.read_csv("某超市的销售数据.csv",encoding='gbk')data=pd.read_csv("某超市的销售数据.csv",encoding='gbk')data.dropna(axis=0,how='any',inplace=True)#删除空值。print(data.head())#输出前五条数据。#print(data.shape)#数据形状。请处理该数据中的缺失值和异常值。
2023-06-26 02:58:36 352 2
原创 matplotlib子图创建
使用subplot()函数绘制网格区域中几何形状相同的子区布局。绘制一个1行2列的子区,然后在两个子区上分别绘制正弦曲线和余弦曲线。依次为两组数据设置颜色样式为--g,:r;设置图标签为L1,L2。import matplotlib.pyplot as pltimport numpy as npplt.subplot(1, 2, 1)x = np.linspace(0, 2*np.pi, 100)y = np.sin(x)plt.plot(x, y, '--g',
2023-06-26 02:53:55 95 1
原创 机器学习metrics模型评估
data1['建筑面积']=data1['建筑面积'].map(lambda p: p.replace('平米',''))data1['总价']=data1['总价'].map(lambda z: z.replace('万',''))data1['建筑面积']=data1['建筑面积'].astype(float)data1['总价']=data1['总价'].astype(float)y=pd.DataFrame(data1['建筑面积'])使用metrics对创建的模型进行评估。
2023-06-26 02:53:34 98 1
原创 机器学习——回归模型房价预测
data['建筑面积']=data['建筑面积'].map(1ambda p:p.replace('平米',''))data[总价']=data['总价'].map(lambda e:e.replace('万',' ')data['建筑面积']=data['建筑面积'].astype(float)y_train=pd.DataFrame(data_train['总价'])data[’总价']=data[’总价'].astype(float)new_data=data[['总价’,'建筑面积']]
2023-06-26 02:50:00 482 1
原创 机器学习-LinearRegression
data['销售总额'] = data['销售数量'] * data['销售金额']data["销售金额"]=data["销售金额"].astype(float)data["销售数量"]=data["销售数量"].astype(float)data=pd.read_excel('某超市销售数据.xlsx')a= data.groupby(['销售月份'])df=data[['销售日期','销售金额']]print(data['销售总额'] )b=a['销售总额'].sum()
2023-06-26 02:49:17 41 1
原创 机器学习-KMeans(3D散点图绘制)
df1['R']=(pd.to_datetime(df1['数据采集时间'])-pd.to_datetime(df1['销售日期'])).values/np.timedelta64(1,'D')df2=df1.groupby('顾客编号').agg({'R':'min','销售金额':'mean'})df1 = df[['顾客编号', '销售金额', '销售日期','数据采集时间']]df1=df1[['顾客编号', '销售金额', '销售日期','R']]r.to_excel('客户价值1.xlsx')
2023-06-26 02:46:54 291 1
原创 机器学习-KMeans
df1['R']=(pd.to_datetime(df1['数据采集时间'])-pd.to_datetime(df1['销售日期'])).values/np.timedelta64(1,'D')df2=df1.groupby('顾客编号').agg({'R':'min','销售金额':'mean'})'''X = df[['顾客编号', '销售金额', '销售日期','数据采集时间']].values。df1=df1[['顾客编号', '销售金额', '销售日期','R']]
2023-06-26 02:38:22 76 1
原创 Numpy数组连接
现有数组A=np.array([[1,2,3,4],[5,6,7,8],[9,10,11,12],[13,14,15,16]])和B= np.array([1,1,1,1]),请将数组A和数组B进行水平连接获得新数组C,即C的前4列来源于A,最后一列来源于B。#注意:数组A和B水平连接要求列数相同,因此B要转换成矩阵。#3.水平连接数组A和数组B。#2.定义数组A和数组B。#1.导入numpy包。
2023-06-26 02:33:08 832 1
原创 Numpy数组运算
现有数组A=np.array([1,3,3.1,4.5])和B= np.array( [[1,2,3,4],(5,6,7,8),[9,10,11,12]]),请求解出A的最大值、最小值、正弦值、余弦值、长度和A乘B的程序。print('A的最大值:',np.amax(A))print('A的最小值:',np.amin(A))print('A的正弦值:',np.sin(A))print('A的余弦值:',np.cos(A))print('A的长度:',len(A))
2023-06-26 02:27:20 367 1
原创 Python作业
1)a[2, 3]、a[2]、a[2][3] 、a[2][:3]、a[:][:3] 、a[:, :3]各自表示什么含义?5)如何通过一个表达式获取第3行第4列、第2行第5列、第4行第1列数据?4)如果想获取大于 10 且 能被 3 整除的数据,如何表示?7)将该数组水平分割为3个子数组:第1列,第2-4列,第5列。2)如果只想获取 第2行 和 第4行 数据,如何表示?3)如果只想获取 第3列 和 第5列 数据,如何表示?6)将该数组垂直平均分割成2个子数组。
2023-06-26 02:08:22 121 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人