第七章debug日志（每日更新至第七章结束）-CSDN博客

本文链接：https://blog.csdn.net/geassXX/article/details/106072317

日期：2020.05.12-2020.05
Ref: <tensorflow工程化项目实战>
章节：chapter7

tf代码分析
P221 line32 tf.feature_column.numeric_column()
解释：构造连续值的特征列。
链接：tf.feature_column.numeric_column().
P221 line39 tf.feature_column.categorical_column_with_vocabulary_list()
解释：分类词汇列。
链接: tf.feature_column.categorical_column_with_vocabulary_list().
P221 line61 tf.feature_column.categorical_column_with_hash_bucket()
解释：哈希列。可设置具有较多类别的特征的类别数量。
P221 line65 tf.feature_column.bucketized_column()
解释：将连续值特征划分成几个离散区间。
P222 line75 tf.feature_column.crossed_column()
解释：组合列。可将有关联的特征进行结合成一个进行分析。
P222 line91 tf.feature_column.indicator_column()
解释：指示列。用于将稀疏矩阵转化成独热编码的形式。
P222 line95 tf.feature_column.embedding_column()
解释：嵌入列。可用于类别较多时。
P224 line139 dataset =tf.data.TextLineDataset(data_file)
解释：生成一个dataset，dataset中的每一个元素就对应了文件中的一行。
P225 line164 feature_spec = tf.feature_column.make_parse_example_spec(columns)
解释：估算器保存pb模型的方式。
链接: tf.feature_column.make_parse_example_spec().
P225 line168 argparse.ArgumentParser
解释：命令行参数接口对象。
链接: argparse.ArgumentParser.
P234 line09 net = tf.feature_column.input_layer(features, [price])
解释：自定义estimator中需要将特征列生成张量形式。
P236 line31 price = tf.feature_column.numeric_column(‘price’, shape=[1, 2])
解释：指定特征列的形状，指的是单条数据。
P240 line10 _LazyBuilder()
解释：封装离散文本特征列。
链接: feature_column.
P241 line29 body_style = tf.feature_column.categorical_column_with_vocabulary_list(
‘name’, vocabulary_list=[‘anna’, ‘gary’, ‘bob’],num_oov_buckets=2)
解释：词表方法对离散文本进行散列。
P248 line05 tf.SparseTensor()
解释：tf生成稀疏张量的函数。
链接: tf.SparseTensor使用说明.
P250 line31 categorical_column_a = tf.contrib.feature_column.sequence_categorical_column_with_identity( #带序列的离散列
key=‘a’, num_buckets=vocabulary_size)
解释：创建带有序列特征的离散列。
P250 line43 tf.feature_column.shared_embedding_columns( )
解释：创建共享张量。使得数据可以使用同一个共享词嵌入。
P256 line62 tf.train.limit_epochs(
tf.convert_to_tensor(points, dtype=tf.float32), num_epochs=300)
解释：tf.convert_to_tensor可将数据变成张量形式。 tf.train.limit_epochs可让模型按照训练集遍历次数训练模型。
链接: tf.convert_to_tensor.
tf.train.limit_epochs官方文档.
P262 line55 tf.nn.embedding_lookup()
解释：选取一个张量里面索引对应的元素。
tf.nn.embedding_lookup函数的用法.
P262 line64 tf.split()
解释：将一个张量切分成几个子张量。
tf.split()函数的用法.

python语法分析
P224 line136 labels = features.pop(‘income_bracket’)
解释：移除列表中的一个元素（默认最后一个元素），并且返回该元素的值。
链接: pop().
P227 line202 loss_prefix = LOSS_PREFIX.get(flags.model_type, ‘’)
解释：get() 函数返回指定键的值，如果值不在字典中返回默认值。
链接: get()方法.
P260 line09 Rating = collections.namedtuple(‘Rating’, [‘user_id’, ‘item_id’, ‘rating’, ‘timestamp’])
解释：collection api中构造具名元组的方法，继承于tuple类。
链接: collections.namedtuple.
记录问题
注意：多特征列顺序取决于各列特征类型字符串排列顺序，见P246