自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 Python数据处理

data=pd.read_csv("某超市的销售数据.csv",encoding='gbk')data=pd.read_csv("某超市的销售数据.csv",encoding='gbk')data.dropna(axis=0,how='any',inplace=True)#删除空值。print(data.head())#输出前五条数据。#print(data.shape)#数据形状。请处理该数据中的缺失值和异常值。

2023-06-26 02:58:36 320 2

原创 matplotlib子图创建

使用subplot()函数绘制网格区域中几何形状相同的子区布局。绘制一个1行2列的子区,然后在两个子区上分别绘制正弦曲线和余弦曲线。依次为两组数据设置颜色样式为--g,:r;设置图标签为L1,L2。import matplotlib.pyplot as pltimport numpy as npplt.subplot(1, 2, 1)x = np.linspace(0, 2*np.pi, 100)y = np.sin(x)plt.plot(x, y, '--g',

2023-06-26 02:53:55 72 1

原创 机器学习metrics模型评估

data1['建筑面积']=data1['建筑面积'].map(lambda p: p.replace('平米',''))data1['总价']=data1['总价'].map(lambda z: z.replace('万',''))data1['建筑面积']=data1['建筑面积'].astype(float)data1['总价']=data1['总价'].astype(float)y=pd.DataFrame(data1['建筑面积'])使用metrics对创建的模型进行评估。

2023-06-26 02:53:34 82 1

原创 机器学习——回归模型房价预测

data['建筑面积']=data['建筑面积'].map(1ambda p:p.replace('平米',''))data[总价']=data['总价'].map(lambda e:e.replace('万',' ')data['建筑面积']=data['建筑面积'].astype(float)y_train=pd.DataFrame(data_train['总价'])data[’总价']=data[’总价'].astype(float)new_data=data[['总价’,'建筑面积']]

2023-06-26 02:50:00 456 1

原创 机器学习-LinearRegression

data['销售总额'] = data['销售数量'] * data['销售金额']data["销售金额"]=data["销售金额"].astype(float)data["销售数量"]=data["销售数量"].astype(float)data=pd.read_excel('某超市销售数据.xlsx')a= data.groupby(['销售月份'])df=data[['销售日期','销售金额']]print(data['销售总额'] )b=a['销售总额'].sum()

2023-06-26 02:49:17 33 1

原创 机器学习-KMeans(3D散点图绘制)

df1['R']=(pd.to_datetime(df1['数据采集时间'])-pd.to_datetime(df1['销售日期'])).values/np.timedelta64(1,'D')df2=df1.groupby('顾客编号').agg({'R':'min','销售金额':'mean'})df1 = df[['顾客编号', '销售金额', '销售日期','数据采集时间']]df1=df1[['顾客编号', '销售金额', '销售日期','R']]r.to_excel('客户价值1.xlsx')

2023-06-26 02:46:54 266 1

原创 机器学习-KMeans

df1['R']=(pd.to_datetime(df1['数据采集时间'])-pd.to_datetime(df1['销售日期'])).values/np.timedelta64(1,'D')df2=df1.groupby('顾客编号').agg({'R':'min','销售金额':'mean'})'''X = df[['顾客编号', '销售金额', '销售日期','数据采集时间']].values。df1=df1[['顾客编号', '销售金额', '销售日期','R']]

2023-06-26 02:38:22 64 1

原创 Numpy数组连接

现有数组A=np.array([[1,2,3,4],[5,6,7,8],[9,10,11,12],[13,14,15,16]])和B= np.array([1,1,1,1]),请将数组A和数组B进行水平连接获得新数组C,即C的前4列来源于A,最后一列来源于B。#注意:数组A和B水平连接要求列数相同,因此B要转换成矩阵。#3.水平连接数组A和数组B。#2.定义数组A和数组B。#1.导入numpy包。

2023-06-26 02:33:08 736 1

原创 Numpy数组运算

现有数组A=np.array([1,3,3.1,4.5])和B= np.array( [[1,2,3,4],(5,6,7,8),[9,10,11,12]]),请求解出A的最大值、最小值、正弦值、余弦值、长度和A乘B的程序。print('A的最大值:',np.amax(A))print('A的最小值:',np.amin(A))print('A的正弦值:',np.sin(A))print('A的余弦值:',np.cos(A))print('A的长度:',len(A))

2023-06-26 02:27:20 297 1

原创 Python作业

1)a[2, 3]、a[2]、a[2][3] 、a[2][:3]、a[:][:3] 、a[:, :3]各自表示什么含义?5)如何通过一个表达式获取第3行第4列、第2行第5列、第4行第1列数据?4)如果想获取大于 10 且 能被 3 整除的数据,如何表示?7)将该数组水平分割为3个子数组:第1列,第2-4列,第5列。2)如果只想获取 第2行 和 第4行 数据,如何表示?3)如果只想获取 第3列 和 第5列 数据,如何表示?6)将该数组垂直平均分割成2个子数组。

2023-06-26 02:08:22 110 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除