将数据保存为CSV形式存储

将数据保存为CSV形式存储

可以使用pandas.Dataframe.to_csv()函数来储存数据为csv文件。

以下展示为自定义函数实现数据存储为csv文件:
函数标注已经写在代码中:
代码示例:

import numpy as np
import sklearn   
import pandas as pd 
import os 
import sys 
import tensorflow as tf 
from tensorflow import keras 
from sklearn.datasets import fetch_california_housing #从sklearn中引用加州的房价数据

housing = fetch_california_housing()
print(housing.DESCR)
print(housing.data.shape)
print(housing.target.shape)
#引用train_test_split对数据集进行拆分
# test_size 控制切分比例,默认切分比例3:1
from sklearn.model_selection import train_test_split  

#拆分数据集,加载数据集后返回训练集以及测试集
x_train_all, x_test, y_train_all, y_test = train_test_split(housing.data, housing.target, random_state = 1) 

#将训练集进行一次拆分为验证集和测试集
x_train, x_valid, y_train, y_valid = train_test_split(x_train_all, y_train_all, random_state=2)

print(x_train.shape, y_train.shape)
print(x_valid.shape, y_valid.shape)
print(x_test.shape, y_test.shape)

(11610, 8) (11610,)
(3870, 8) (3870,)
(5160, 8) (5160,)

from sklearn.preprocessing import StandardScaler

scaler = StandardScaler()
#对数据进行归一化处理

#由于transform处理处理数据时二维数组,所以要将数据转化一下
#x_train: [none, 28, 28] -> [none, 784]
#对于使用fit_transform 和transform 请参考我的TensorFlow中的博客
x_train_scaled = scaler.fit_transform(x_train)
x_valid_scaled = scaler.transform(x_valid)
x_test_scaled = scaler.transform(x_test)
from sklearn.preprocessing import StandardScaler

scaler = StandardScaler()
#对数据进行归一化处理

#由于transform处理处理数据时二维数组,所以要将数据转化一下
#x_train: [none, 28, 28] -> [none, 784]
#对于使用fit_transform 和transform 请参考我的TensorFlow中的博客
x_train_scaled = scaler.fit_transform(x_train)
x_valid_scaled = scaler.transform(x_valid)
x_test_scaled = scaler.transform(x_test)
from sklearn.preprocessing import StandardScaler

scaler = StandardScaler()
#对数据进行归一化处理

#由于transform处理处理数据时二维数组,所以要将数据转化一下
#x_train: [none, 28, 28] -> [none, 784]
#对于使用fit_transform 和transform 请参考我的TensorFlow中的博客
x_train_scaled = scaler.fit_transform(x_train)
x_valid_scaled = scaler.transform(x_valid)
x_test_scaled = scaler.transform(x_test)
# np.c_[] : 按照列连接字符串
train_data = np.c_[x_train_scaled, y_train]
valid_data = np.c_[x_valid_scaled, y_valid]
test_data = np.c_[x_test_scaled, y_test]

#将添加的新的一列Y值添加一个列名
header_cols = housing.feature_names + ["MidanHouseValue"]
header_str = ",".join(header_cols)

#生成csv文件
train_filenames = save_to_csv(output_dir, train_data, "train", header_str, n_parts=20)
valid_filenames = save_to_csv(output_dir, valid_data, "valid", header_str, n_parts=10)
test_filenames = save_to_csv(output_dir, test_data, "test", header_str, n_parts=10)
### 回答1: 你可以使用 Pandas 库中的 `to_csv()` 方法将 DataFrame 保存CSV 格式文件。以下是示例代码: ```python import pandas as pd # 创建一个示例DataFrame data = {'Name': ['Tom', 'Jack', 'Steve', 'Ricky'], 'Age': [28, 34, 29, 42]} df = pd.DataFrame(data) # 将DataFrame保存CSV文件 df.to_csv('example.csv', index=False) ``` 在上面的示例中,我们首先创建了一个示例 DataFrame,然后使用 `to_csv()` 方法将其保存为名为 `example.csv` 的文件。 `index=False` 参数用于指示不要保存 DataFrame 的行索引。 ### 回答2: Pandas是一个流行的数据处理和分析工具,可以轻松地将数据保存CSV文件格式。CSV(逗号分隔值)是一种常用的数据存储和交换格式,它使用逗号来分隔数据字段。 为了将Pandas数据保存CSV文件,我们可以使用to_csv()方法。首先,我们需要将数据存储在一个Pandas DataFrame对象中。DataFrame是一个二维表格,它由行和列组成,类似于Excel电子表格。 下面是一个示例代码,展示了如何将Pandas数据保存CSV文件: ``` import pandas as pd # 创建一个示例的数据集 data = {'姓名': ['张三', '李四', '王五'], '年龄': [30, 25, 40], '性别': ['男', '女', '男']} df = pd.DataFrame(data) # 将数据保存CSV文件 df.to_csv('example.csv', index=False) ``` 在上面的代码中,我们首先导入了pandas库,并创建了一个包含姓名、年龄和性别的示例数据集。然后,我们使用DataFrame构造函数数据存储在一个DataFrame对象df中。 最后,我们使用to_csv()方法将DataFrame保存CSV文件。to_csv()方法的第一个参数是要保存文件路径和文件名,可以根据需要自定义。我们还可以使用index=False参数来禁止保存索引列。 执行上述代码后,数据将被保存在名为example.csv文件中。可以使用Excel等软件打开该文件,查看和分析数据。 总之,通过使用Pandas的to_csv()方法,我们可以方便地将数据保存CSV文件,以便后续使用和共享。 ### 回答3: 使用pandas保存csv文件非常简单。首先,我们需要将数据存储在一个pandas的DataFrame对象中。DataFrame是pandas中最常用的数据结构,类似于一个二维的表格,可以存储不同类型的数据。 在导入pandas库之后,我们可以使用pandas的read_csv()函数读取现有的csv文件到DataFrame中。接下来,我们可以对DataFrame进行各种操作,例如筛选、排序、计算等等。完成数据处理后,我们可以使用pandas的to_csv()函数将DataFrame保存csv文件。 to_csv()函数的参数包括文件路径和文件名,以及可选的其他参数,如分隔符、编码格式等。当我们调用to_csv()函数时,pandas会自动将DataFrame中的数据保存为指定路径下的csv文件。 以下是一个示例代码: ```python import pandas as pd # 读取csv文件到DataFrame中 df = pd.read_csv('input.csv') # 对DataFrame进行处理 # ... # 将处理后的DataFrame保存csv文件 df.to_csv('output.csv', index=False) # index=False表示不保存行索引 ``` 在上述示例中,我们假设存在一个名为`input.csv`的csv文件,通过read_csv()函数将其读取到DataFrame中。接着,我们对DataFrame进行一些处理操作(可以根据具体需求进行)。最后,我们通过to_csv()函数将修改后的DataFrame保存为名为`output.csv`的csv文件。 使用pandas保存csv文件非常方便,可以轻松地处理和保存各种数据
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值