tf.data加载CSV

最新推荐文章于 2022-12-21 13:38:08 发布

ynchyong

最新推荐文章于 2022-12-21 13:38:08 发布

阅读量293

点赞数

分类专栏：机械学习文章标签：加载CSV tensorflow tf.data

本文链接：https://blog.csdn.net/ynchyong/article/details/109853663

版权

tf.data加载CSV

泰坦尼克号乘客的数据。模型会根据乘客的年龄、性别、票务舱和是否独自旅行等特征来预测乘客生还的可能性

代码

# -*- coding: utf-8 -*-
"""
Created on  2020/11/20 16:17
@Author: CY
@email: 5844104706@qq.com
"""

#泰坦尼克号乘客的数据。模型会根据乘客的年龄、性别、票务舱和是否独自旅行等特征来预测乘客生还的可能性。
import functools

import numpy as np
import tensorflow as tf
import tensorflow_datasets as tfds
TRAIN_DATA_URL = "https://storage.googleapis.com/tf-datasets/titanic/train.csv"
TEST_DATA_URL = "https://storage.googleapis.com/tf-datasets/titanic/eval.csv"

train_file_path = tf.keras.utils.get_file("train.csv", TRAIN_DATA_URL)
test_file_path = tf.keras.utils.get_file("eval.csv", TEST_DATA_URL)
# 让 numpy 数据更易读。
np.set_printoptions(precision=3, suppress=True)
print("1.加载数据")
# CSV 文件的每列都会有一个列名。dataset 的构造函数会自动识别这些列名。
# 如果你使用的文件的第一行不包含列名，那么需要将列名通过字符串列表传给 make_csv_dataset 函数的 column_names 参数
CSV_COLUMNS = ['survived', 'sex', 'age', 'n_siblings_spouses', 'parch', 'fare', 'class', 'deck', 'embark_town', 'alone']
columns_to_use = ['survived', 'sex', 'age', 'n_siblings_spouses', 'parch', 'fare', 'class', 'deck', 'embark_town', 'alone']

#dataset = tf.data.experimental.make_csv_dataset(
#    ...,
#    column_names=CSV_COLUMNS,
#    select_columns = columns_to_use #（可选）使用的列
#    ...)

LABEL_COLUMN = 'survived'
LABELS = [0, 1]
def get_dataset(file_path):
    dataset = tf.data.experimental.make_csv_dataset(
        file_path,
        batch_size=12, # 为了示例更容易展示，手动设置较小的值
        label_name=LABEL_COLUMN,
        na_value="?",
        num_epochs=1,
        ignore_errors=True)
    return dataset

raw_train_data = get_dataset(train_file_path)
raw_test_data = get_dataset(test_file_path)

examples, labels &#

最低0.47元/天解锁文章

ynchyong

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
tf.data加载CSV

tf.data加载CSV泰坦尼克号乘客的数据。模型会根据乘客的年龄、性别、票务舱和是否独自旅行等特征来预测乘客生还的可能性代码# -*- coding: utf-8 -*-"""Created on 2020/11/20 16:17@Author: CY@email: 5844104706@qq.com"""#泰坦尼克号乘客的数据。模型会根据乘客的年龄、性别、票务舱和是否独自旅行等特征来预测乘客生还的可能性。import functoolsimport numpy as npi
复制链接

扫一扫