- 博客(4)
- 资源 (10)
- 收藏
- 关注
原创 【Multiprocessing】采用多进程计算处理数据
0x00 前言在数据处理方面,通常会将较为简单的源数据存于本地磁盘中, 每次使用时读取,经过生成函数生成模型可以直接使用的训练数据, 而这种数据通常为矩阵的形式,考虑到padding位的情况下通常较大, 那么,在源数据的量较大,而生成的数据的空间占用增量巨大无法存于本地, 就需要采用生成一个,传输一个,消耗一个,之后再生成的形式。线性终归是缓慢的,此时就需要多线程进行处理, 如下...
2018-06-28 21:23:32 1194
原创 【Tensorflow】自主实现包含全节点Cell的LSTM层(Cell-Holding LSTM Layer)
0x00 前言常用的LSTM,或是双向LSTM,输出的结果通常是以下两个: 1) outputs,包括所有节点的hidden 2) 末节点的state,包括末节点的hidden和cell 大部分任务有这些就足够了,state是随着节点间信息的传递依次变化并容纳更多信息, 所以通常末状态的cell就囊括了所有信息,不需要中间每个节点的cell信息, 但如果我们的研究过程中需要用到这些c...
2018-06-28 17:17:30 974
原创 【Tensorflow】自主实现部分连接层(Partial Connect Layer)
0x00 前言通常而言,在NLP领域的机器学习中时常会有这样的需求:argmaxP(wi∣θ)argmaxP(wi∣θ) argmax P(w_i \mid \theta) 较为常见的做法是有多少个单词就做一个多少维的全连接层加softmax,但是, 如果词汇表 |V||V||V| 很大的情况下,会有大量的计算(例如目前的工作中,词汇表的数量为80k), 在我们已知只需要计算其中某些词...
2018-06-28 15:54:40 1815
原创 第三十五次codeforces竞技结束 #483 Div 2
0x00 前言啥都不说了,居然出了四题, 令我不仅产生了错觉:老选手也能有朝一日恢复到刚开始集训时的状态? 觉得浑身充满了活力QvQ!(可惜了这次用的不是自己的号QvQ,220名呀……) 那么这次比赛得到了一个怎样的教训呢?(看见那些TLE了么) ——老老实实给我用 printf() 和 scanf()! ——竞技编程除非字符串处理,没有 cin>> 和 cout<...
2018-06-12 10:12:12 375
【PSP录制工具】RemoteJoy_Lite_019_CHT
2018-03-25
From Online Behaviors to Offline Retailing
2016-07-03
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人