- 博客(8)
- 资源 (378)
- 论坛 (89)
- 问答 (37)
- 收藏
- 关注
原创 tf.keras.layers.Dense 在 reuse 时有坑
with tf.variable_scope("", reuse=tf.AUTO_REUSE): model_train = MyModel( is_training=True)with tf.variable_scope("", reuse=True): model_dev = MyModel( is_training=False)model_train.train(data_train, data_dev, model_dev)MyModel里有t
2020-07-17 11:52:28
313
原创 TensorFlow 构造 attention mask 或 causal mask
def upper_triangle_bias(D, dtype=tf.float32): """Create a upper triangle matrix for decoding bias.""" upper_triangle_DxD = 1 - tf.matrix_band_part( tf.ones([D, D], dtype=dtype), -1, 0) tensor_1xDxD = tf.expand_dims(upper_triangle_DxD *
2020-07-14 09:58:18
287
原创 tf.estimator tf.data 混合不同的数据
import tensorflow as tfdataset_1 = tf.data.Dataset.from_tensors(1).repeat(20)dataset_2 = tf.data.Dataset.from_tensors(2).repeat(20)dataset = tf.data.Dataset.zip((dataset_1, dataset_2))dataset = dataset.batch(8)dataset = dataset.map(lambda a, b: tf.c
2020-07-07 14:18:13
150
原创 ValueError: Paddings must be non-negative for ‘gradients/lstm_cell/Slice_257_grad/Pad‘ (op: ‘Pad‘)
同时也报错:has no attr named ‘_XlaCompile’解决方案:RNN的实现由from tensorflow.contrib.rnn import LSTMCell改为tf.keras.layers.LSTMCell
2020-07-06 17:27:58
496
原创 TensorFlow 根据condition条件选择一个batch里的部分数据
import tensorflow as tfdata_type = tf.constant([1, 2, 1, 2])where_index1 = tf.where(tf.equal(data_type, 1))where_index2 = tf.where(tf.equal(data_type, 2))data = tf.constant([[10,10],[20,20],[30,30],[40,40]])data1 = tf.gather_nd(data,where_index1)d
2020-07-06 13:06:16
313
原创 tf.estimator tf.data 处理混合的不同的数据
import tensorflow as tfdata_type = tf.constant([1, 2, 1, 2])where_index1 = tf.where(tf.equal(data_type, 1))where_index2 = tf.where(tf.equal(data_type, 2))data = tf.constant([[10,10],[20,20],[30,30],[40,40]])data1 = tf.gather_nd(data,where_index1)d
2020-07-06 11:10:17
150
原创 TensorFlow if语句 tensor 和 非tensor 比较
import tensorflow as tfcondition = tf.placeholder(tf.int32, name="condition")A = tf.constant(value=123)B = tf.constant(value=321)def func1(): return Adef func2(): return By = tf.cond(condition > 0, func1, func2)sess = tf.Session()
2020-07-01 19:06:01
345
原创 TensorFlow 使用上个模型输出的一个向量表示 来给RNN生成一段文本
import tensorflow as tffrom tensorflow.contrib.rnn import LSTMCellcell = LSTMCell(128,state_is_tuple=False)init_state = tf.random_normal([16,128]) # 可以是上一模型的输出output,new_state = cell(inputs=init_state,state=init_state)for i in range(20): outpu
2020-07-01 11:12:06
134
cuda_10.0.130_410.48_linux.run
2020-06-21
torchvision-0.6.0+cu101-cp36-cp36m-linux_x86_64.whl
2020-06-21
tcl8.6.8-src.tar.gz
2018-02-25
tk8.6.8-src.tar.gz
2018-02-25
Mapping of Freebase entities to Wikidata entities 数据集
2017-06-09
1-billion-word-language-modeling-benchmark-r13output-part2
2018-10-22
NLTK wordnet_ic.zip
2019-12-02
Spark: Cluster Computing with Working Sets
2014-04-15
Facebook的SimpleQuestions数据集
2017-03-29
glove.twitter.27B.200d.txt
2018-04-10
_bz2.cpython-36m-x86_64-linux-gnu.so
2017-10-30
pointer network 用到的数据
2017-07-14
pytorch resnet 152 模型参数数据
2017-12-29
FB15K 数据集
2018-03-02
aclImdb_v1.tar.gz
2020-11-19
train-images-idx3-ubyte.gz 和 train-labels-idx1-ubyte.gz
2020-12-03
tensorflow_gpu-1.15.0-cp36-cp36m-manylinux2010_x86_64.whl
2020-11-06
WebQuestions 数据集
2018-03-02
编译时 java -d 是什么意思?
发表于 2011-01-20 最后回复 2020-03-26
android 怎么输出变量的的值到log
发表于 2011-06-09 最后回复 2020-03-12
guotong1988的留言板
发表于 2020-01-02 最后回复 2020-01-02
请问linux里的 # 和 $ 都有什么意思啊?
发表于 2011-01-24 最后回复 2018-06-19
问下付费VIP能扩大上传资源权限到500M吗
发表于 2017-12-04 最后回复 2017-12-04
怎么用html里的button里的onclick的运行一段java
发表于 2011-02-23 最后回复 2017-09-30
linux里面有很多goto,为什么明确不提倡用goto
发表于 2012-01-14 最后回复 2017-08-05
华为手机的AI部门 和 联想的AI部门 去哪个
发表于 2016-11-20 最后回复 2016-11-21
做AI的话是搞 底层框架大牛 和 应用层业务大牛 哪个有前途?
发表于 2016-11-20 最后回复 2016-11-21
什么情况下用plsql?
发表于 2015-03-12 最后回复 2016-10-26
为什么我是博客专家了还是不能把微博搞上
发表于 2016-01-25 最后回复 2016-01-28
创业公司老板兼CTO把我们看成打杂的怎么办???
发表于 2014-11-14 最后回复 2016-01-15
一段scala代码读不懂。。。
发表于 2015-03-02 最后回复 2015-04-22
jsp问题,入门级,求助啊!!! 搜遍了网上方法,(附图)
发表于 2015-03-18 最后回复 2015-03-24
Java 线程共用run方法里的代码段吗?
发表于 2014-11-24 最后回复 2015-03-02
为什么列式数据库适用于OLAP,行式数据库适用于OLTP?
发表于 2014-10-18 最后回复 2015-03-02
问下搞机器学习的童鞋,都用什么数据库,还是不用数据库?
发表于 2015-02-05 最后回复 2015-03-02
如何把 linux0.11更高的版本 用bochs编译并运行
发表于 2014-12-23 最后回复 2015-03-02
小弟今年27了,该不该跳这个槽,明天给那边回复
发表于 2015-02-01 最后回复 2015-03-02
有多少人和我一样觉得老板兼CTO从不考虑员工所想的
发表于 2014-11-11 最后回复 2015-01-04
从mysql、oracle、sqlserver、db2里取数据,怎样取最快?
发表于 2014-11-12 最后回复 2014-11-19
世界上有哪些非计算机专业出身的IT精英?
发表于 2014-11-09 最后回复 2014-11-11
求推荐一款优秀的开源的数据库管理工具,可以支持mysql、oracle、sqlserver、db2等。
发表于 2014-11-06 最后回复 2014-11-09
the import com.mysql can not be resolved 请问
发表于 2011-02-21 最后回复 2014-10-31
怎么把 指针b的指向的地址作为值 放到指针a指向的地址里?
发表于 2014-10-19 最后回复 2014-10-19
Java,我有一个外网IP比如7.7.7.7:port的server,想和一内网192.168.0.13client通信,server端求个java小例子
发表于 2013-08-27 最后回复 2014-10-18
windows核心编程 看不懂
发表于 2012-02-25 最后回复 2014-03-14
各位大侠,什么书有讲C++多线程的知识?
发表于 2012-02-20 最后回复 2013-08-27
各位大侠,什么书里有讲P,V操作的?
发表于 2012-03-04 最后回复 2013-08-27
as3 addchild() 的机制????????
发表于 2011-09-05 最后回复 2013-07-28
如何实现比如五子棋的联机对战,在iphone上,主要是网络编程方面
发表于 2011-06-10 最后回复 2012-11-23
谁帮我详细解释下这句: <script type="text/javascript">
发表于 2011-02-21 最后回复 2012-09-20
比如做一个 绑定IE首页的程序 需要什么知识?看什么书?
发表于 2012-02-19 最后回复 2012-02-20
做游戏 美工 和 程序 可否都学?
发表于 2012-02-16 最后回复 2012-02-19
各位大侠 想做游戏 程序 和 美工 可不可以都学?
发表于 2012-02-16 最后回复 2012-02-19
哪里可以做业余项目?
发表于 2012-02-05 最后回复 2012-02-16
征女友,见头像
发表于 2012-02-05 最后回复 2012-02-05
大家怎么看 程序实现 和 更好的实现 这件事?
发表于 2011-11-01 最后回复 2012-01-20
大家怎么看 程序功能实现 和 更好的实现 这件事?
发表于 2011-11-01 最后回复 2011-11-11
android的调试速度怎么这么慢
发表于 2011-10-28 最后回复 2011-11-01
2021年了,有哪些稳压bert和roberta的预训练模型?
2021-01-20
现在机器学习的库都是Python的,而服务器貌似是Java性能最好,怎么处理这个问题?
2016-11-22
gdb都能调试什么类型的文件?
2016-10-17
Spark里一行scala代码看不懂?
2016-02-29
spark example 有个地方看不懂
2016-02-01
maven,自己的 程序包不存在?
2015-12-03
Eclipse有办法打Jar包时自动解决(自身项目内的)依赖问题吗?
2015-12-03
google的protobuf比这样java原生的方式更有效率吗?
2015-11-19
.h文件里定义了一个类,怎么链接到so文件里?
2015-09-09
cocos2d-x lua怎么滤色?
2015-09-02
看jvm某个类的成员变量的值
2015-08-28
JAVA怎么从特定【行】开始读字串?
2015-08-24
一小段scala代码看不懂?
2015-08-21
scala如何初始化一个Tuple3数组?
2015-08-18
用jstack看到的WAITING和BLOCK的区别的是什么
2015-08-18
Spark里的DAG是怎么回事?
2015-08-12
invoke方法如何加-Xmx2000M之类的VM参数
2015-08-03
spark1.2里的一小段scala代码看不懂
2015-03-03
为什么数据库要插入数据后再建B-Tree等结构的索引,而不是边插边建?
2015-03-24
Spark哪些分布式计算可以脱离HDFS跑?
2015-07-03
Eclipse里如何debug跟踪MapReduce程序到hadoop源码里?
2015-07-31
有没有自动生成复杂sql的软件?
2015-07-14
java swing awt, 如何实现一个按钮按下之后刷新界面
2015-07-03
java正则表达式,怎么写一个match包含空格的pattern?
2015-06-04
java正则表达式,如何表示一个非某个字符的匹配
2015-06-04
为什么hdfs不支持随机写?
2015-03-11
java项目里什么情况下用PL/SQL?
2015-03-12
jsp问题,入门级,求助啊!!! 搜遍了网上方法,(附图)
2015-03-18
比较新的MinGW5怎么用啊?
2014-12-24
有几百个进程却只有几G的内存,求解释这几百个进程如何共享内存的?
2015-01-05
bochs里面运行的linux可以和外面通信吗?
2014-12-23
求大神解释下NUMA、UMA、SMP这三种CPU架构?
2014-12-22
github ,merge后我的fork自动ahead于‘主干’1commit
2014-12-18
java 线程共用代码段吗?
2014-11-24
TA创建的收藏夹 TA关注的收藏夹
TA关注的人 TA的粉丝