第七章debug日志(每日更新至第七章结束)

日期:2020.05.12-2020.05
Ref: <tensorflow工程化项目实战>
章节:chapter7

tf代码分析
P221 line32 tf.feature_column.numeric_column()
解释:构造连续值的特征列。
链接:tf.feature_column.numeric_column().
P221 line39 tf.feature_column.categorical_column_with_vocabulary_list()
解释:分类词汇列。
链接: tf.feature_column.categorical_column_with_vocabulary_list().
P221 line61 tf.feature_column.categorical_column_with_hash_bucket()
解释:哈希列。可设置具有较多类别的特征的类别数量。
P221 line65 tf.feature_column.bucketized_column()
解释:将连续值特征划分成几个离散区间。
P222 line75 tf.feature_column.crossed_column()
解释:组合列。可将有关联的特征进行结合成一个进行分析。
P222 line91 tf.feature_column.indicator_column()
解释:指示列。用于将稀疏矩阵转化成独热编码的形式。
P222 line95 tf.feature_column.embedding_column()
解释:嵌入列。可用于类别较多时。
P224 line139 dataset =tf.data.TextLineDataset(data_file)
解释:生成一个dataset,dataset中的每一个元素就对应了文件中的一行。
P225 line164 feature_spec = tf.feature_column.make_parse_example_spec(columns)
解释:估算器保存pb模型的方式。
链接: tf.feature_column.make_parse_example_spec().
P225 line168 argparse.ArgumentParser
解释:命令行参数接口对象。
链接: argparse.ArgumentParser.
P234 line09 net = tf.feature_column.input_layer(features, [price])
解释:自定义estimator中需要将特征列生成张量形式。
P236 line31 price = tf.feature_column.numeric_column(‘price’, shape=[1, 2])
解释:指定特征列的形状,指的是单条数据。
P240 line10 _LazyBuilder()
解释:封装离散文本特征列。
链接: feature_column.
P241 line29 body_style = tf.feature_column.categorical_column_with_vocabulary_list(
‘name’, vocabulary_list=[‘anna’, ‘gary’, ‘bob’],num_oov_buckets=2)
解释:词表方法对离散文本进行散列。
P248 line05 tf.SparseTensor()
解释:tf生成稀疏张量的函数。
链接: tf.SparseTensor使用说明.
P250 line31 categorical_column_a = tf.contrib.feature_column.sequence_categorical_column_with_identity( #带序列的离散列
key=‘a’, num_buckets=vocabulary_size)
解释:创建带有序列特征的离散列。
P250 line43 tf.feature_column.shared_embedding_columns( )
解释:创建共享张量。使得数据可以使用同一个共享词嵌入。
P256 line62 tf.train.limit_epochs(
tf.convert_to_tensor(points, dtype=tf.float32), num_epochs=300)
解释:tf.convert_to_tensor可将数据变成张量形式。 tf.train.limit_epochs可让模型按照训练集遍历次数训练模型。
链接: tf.convert_to_tensor.
tf.train.limit_epochs官方文档.
P262 line55 tf.nn.embedding_lookup()
解释:选取一个张量里面索引对应的元素。
tf.nn.embedding_lookup函数的用法.
P262 line64 tf.split()
解释:将一个张量切分成几个子张量。
tf.split()函数的用法.

python语法分析
P224 line136 labels = features.pop(‘income_bracket’)
解释:移除列表中的一个元素(默认最后一个元素),并且返回该元素的值。
链接: pop().
P227 line202 loss_prefix = LOSS_PREFIX.get(flags.model_type, ‘’)
解释:get() 函数返回指定键的值,如果值不在字典中返回默认值。
链接: get()方法.
P260 line09 Rating = collections.namedtuple(‘Rating’, [‘user_id’, ‘item_id’, ‘rating’, ‘timestamp’])
解释:collection api中构造具名元组的方法,继承于tuple类。
链接: collections.namedtuple.
记录问题
注意:多特征列顺序取决于各列特征类型字符串排列顺序,见P246

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值