机器学习错误2 将DataFrame完整导出成csv文件

最新推荐文章于 2024-05-03 09:47:07 发布

dd112474

最新推荐文章于 2024-05-03 09:47:07 发布

阅读量2.8k

点赞数 1

分类专栏：机器学习文章标签：机器学习 python pandas

本文链接：https://blog.csdn.net/dd112474/article/details/126541157

版权

机器学习专栏收录该内容

21 篇文章 1 订阅

订阅专栏

文章目录

生成DataFrame

在写代码时，我们会用到DataFrame来更直观的观察代码

当然在此之前，需要在第一行import所需要的各种包
在这里插入图片描述
生成数据后，用pd.DataFrame()但是这个表是简略版的，如果需要完整查看，就需要导出成CSV文件

导出代码

outputpath='C:/Users/DANNY/Desktop/DataFrame导出.csv'
result_df.to_csv(outputpath,sep=',',index=False,header=True)

其中1处是导出的位置，需要注意的是复制过来的是\要改成/
比如：C:\Users\DANNY\Desktop\ ----> C:/Users/DANNY/Desktop/

其中2处是导出文件的名称，可以自己取，我这里是叫DataFrame导出

其他outputpath = ' .csv'是不变的
在这里插入图片描述
第二行

result_df.to_csv(outputpath,sep=',',index=False,header=True)

只需要改变False和True即可，需要index就把index=False 改成 index=True

导出结果

在这里插入图片描述

参考链接（优质）

【Python】 DataFrame输出为csv\txt\xlsx文件

机器学习8

全文代码

在这里插入图片描述

import pandas as pd 
import numpy as np
from sklearn.cluster import KMeans
from sklearn.cluster import DBSCAN
from matplotlib import pyplot as plt

### KMeans算法

#### 准备数据集

data = pd.read_csv('销售利润表.csv')
data

data.shape

data.info()

data.head()

data.describe()

data.drop(columns="Unnamed: 0",inplace=True) #删除未命名那列

data.head()

#### 构建KMeans模型

KMeans?

km = KMeans(n_clusters=8,max_iter=300,tol=0.01) #写km = KMeans()也可以，因为是默认值

#### 训练模型

km.fit(data)

#### 查看属性

#质心
km.cluster_centers_

#属于哪个簇
km.labels_

#误差平方和
km.inertia_

#### 最优模型（调参）

result = []
for n_clusters in range(2,10):
    for max_iter in range(300,601,50): #最大迭代次数
        for tol in range(2,10):
            tol=tol*1e-5
            km = KMeans(n_clusters=n_clusters,max_iter==max_iter,tol=tol)
            km.fit(data)
            d={'n_clusters':n_clusters,'max_iter':max_iter,'tol':tol,'inertia':km.inertia_}
            result.append(d)



result = []
for n_clusters in range(2,10):
    for max_iter in range(300,601,50): #最大迭代次数
        for tol in range(2,10):
            tol=tol*1e-5
            km = KMeans(n_clusters=n_clusters,max_iter=max_iter,tol=tol)
            km.fit(data)
            d={'n_clusters':n_clusters,'max_iter':max_iter,'tol':tol,'inertia':km.inertia_}
            result.append(d)
# 一个模型的参数放在字典d里面，用result.append(d)把所有模型的参数存起来到result列表

result

result_df = pd.DataFrame(result) #主要DataFrame的DF都大写
result_df

outputpath='C:/Users/DANNY/Desktop/DataFrame导出.csv'
result_df.to_csv(outputpath,sep=',',index=False,header=True)

dd112474

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
机器学习错误2 将DataFrame完整导出成csv文件

比如：C:\Users\DANNY\Desktop\ ----> C:/Users/DANNY/Desktop/其中2处是导出文件的名称，可以自己取，我这里是叫DataFrame导出。但是这个表是简略版的，如果需要完整查看，就需要导出成CSV文件。在写代码时，我们会用到DataFrame来更直观的观察代码。只需要改变False和True即可，需要index就把。当然在此之前，需要在第一行import所需要的各种包。其中1处是导出的位置，需要注意的是复制过来的是。...
复制链接

扫一扫