- 博客(18)
- 资源 (385)
- 问答 (103)
- 收藏
- 关注
原创 销量等大数值特征输入深度模型
一个特征的值如果是 100000、150000 这样的,怎么输入到模型里?比如这个特征就是销量?决策树直接输入,普通模型做下上下界截断然后做一些log或者sqrt的处理,大模型可以离散化,直接int离散化或者做log后离散化都行...
2020-04-29 17:23:47 273
原创 TensorFlow 的KL divergence的实现
def kl_for_log_probs(log_p, log_q): p = tf.exp(log_p) neg_ent = tf.reduce_sum(p * log_p, axis=-1) neg_cross_ent = tf.reduce_sum(p * log_q, axis=-1) kl = neg_ent - neg_cross_ent ret...
2020-04-28 19:17:08 3185
原创 Differentiable Reasoning over a Virtual Knowledge Base 代码
https://github.com/google-research/language/tree/master/language/labs/drkit
2020-04-28 16:28:49 402
原创 AutoPhrase 阅读笔记
论文名:Automated Phrase Mining from Massive Text Corpora摘要本文研究关键短语提取,研究无监督的,使用了通用知识库信息来做,使用了词性信息提升效果,引言Phrase mining的意思是短语(实体、关键词)提取,本文贡献:使用通用知识库的来构造正样本(应该就是用完全匹配的方式),然后训练一个分类器,然后用这个分类器的预测结果来减少负样本噪...
2020-04-28 15:25:52 3102
原创 BERT加速,BERT inference加速,BERT实用加速
从头预训练一个针对的那1个任务的3层BERT,保持预训练和inference时的一致性,速度加速4倍,精度不变。
2020-04-28 10:24:33 1195 2
原创 gitignore 刷新
https://stackoverflow.com/questions/38450276/force-git-to-update-gitignore
2020-04-15 17:03:39 343
原创 tensorflow 一个模型两个学习率
tvars = tf.trainable_variables()var_list1 = [var for var in tvars if "bert" in var.name]var_list2 = [var for var in tvars if "bert" not in var.name]opt1 = tf.train.GradientDescentOptimizer(0.00001)...
2020-04-15 15:43:33 399
原创 spark,在左表右表都有重复数据的情况下,left join之后数据数量等于左表
给左表人工加一个id列,最后按这个id列distinct就行了。
2020-04-14 13:51:46 1194
原创 spark groupby之后再展开 实例
import org.apache.spark.sql.{Row, SparkSession}object Test { def main(args: Array[String]): Unit = { val spark = SparkSession.builder.appName("Simple Application").enableHiveSupport().getOrC...
2020-04-14 12:27:48 971
原创 imdb、SST-1、SST-2、yelp-2013、yelp-2014 文本分类数据集
https://github.com/JerrikEph/Capsule4TextClassification/blob/master/data/downloadDataset.md
2020-04-10 15:25:36 4687
原创 短文本分类数据集(英文)
https://opendata.stackexchange.com/questions/6080/data-sets-for-short-text-classification
2020-04-10 13:15:33 2105 2
原创 pycharm debug F8 slow / variable not show
Preference --> python debugger --> Gevent compatible勾选后重跑
2020-04-10 11:21:59 228 1
原创 tensorflow 构造对角线为0的矩阵,并mask
import tensorflow as tfsess = tf.Session()input = tf.ones([2,3,3])*2mask1 = tf.ones([3,3])mask2 = tf.diag(tf.ones([3]))mask = mask1 - mask2print(sess.run(mask))print(sess.run(input * mask))...
2020-04-09 11:47:14 1102
原创 tensorflow 构造对角线为1的矩阵,并mask
import tensorflow as tfsess = tf.Session()input = tf.ones([2,3,3])*2mask = tf.diag(tf.ones([3]))print(sess.run(mask))print(sess.run(input * mask))print结果:[[1. 0. 0.][0. 1. 0.][0. 0. 1.]][...
2020-04-09 11:40:26 2847
原创 ICLR 2020 ENERGY BASED MODEL 摘要速览
YOUR CLASSIFIER IS SECRETLY AN ENERGY BASEDMODEL AND YOU SHOULD TREAT IT LIKE ONEhttps://openreview.net/group?id=ICLR.cc/2020/Conference#accept-talk引言discriminative分类器表示为 p(y|x),可以基于能量型模型 把它重新推导成...
2020-04-09 10:38:24 511
原创 矩阵分解的一些理解
attention matrix 是一个 [batch_size, sequence_len1, hidden_size] 的tensor和一个[batch_size, sequence_len2, hidden_size] 的tensor得到的[batch_size, sequence_len1, sequence_len2] 的tensor,反过来其实就是一个矩阵分解操作,[seque...
2020-04-03 15:01:26 343
原创 Structural Deep Clustering Network 摘要速览
https://arxiv.org/pdf/2002.01633.pdfClustering is a fundamental task in data analysis. Recently, deepclustering, which derives inspiration primarily from deep learningapproaches, achieves state-of-...
2020-04-01 10:31:38 747
huggingface的bert-base-chinese
2024-03-05
huggingface的bert-base-uncased
2024-03-03
Deep (Convolution) Networks from First Principles by马毅老师
2023-09-26
NLPIR新闻语料库(2400万字)
2023-08-30
CLUE AFQMC 语义相似度 数据集
2023-07-24
CLUE TNEWS 文本分类数据集
2023-07-24
MovieLens 20M Dataset
2022-05-31
MovieLens 25M Dataset
2022-05-17
criteo dataset(CTR数据集)part3
2022-03-27
criteo dataset(CTR数据集)part2
2022-03-27
criteo dataset(CTR数据集)part1
2022-03-27
onnxruntime-1.5.2.jar
2020-12-03
train-images-idx3-ubyte.gz 和 train-labels-idx1-ubyte.gz
2020-12-03
How to write a good CVPR submission
2020-11-27
aclImdb_v1.tar.gz
2020-11-19
tensorflow_gpu-1.15.3-cp36-cp36m-manylinux2010_x86_64.whl
2020-11-06
tensorflow_gpu-1.15.2-cp36-cp36m-manylinux2010_x86_64.whl
2020-11-06
tensorflow_gpu-1.15.0-cp36-cp36m-manylinux2010_x86_64.whl
2020-11-06
tensorflow_gpu-1.15.4-cp36-cp36m-manylinux2010_x86_64.whl
2020-11-06
tensorflow-1.14.0-cp36-cp36m-macosx_10_11_x86_64.whl
2020-10-27
tensorflow-2.3.0-cp36-cp36m-macosx_10_11_x86_64.whl
2020-10-27
annotated_wikisql_and_PyTorch_bert_param.zip
2020-10-22
自动驾驶,如何得到方向盘转动的ground truth?
2024-03-18
AlphaGo能超越人类,因为训练时 对于模型的每个输入,都有一个100%正确的答案?
2024-01-16
其实LLM/ChatGPT是否在距离AlphaGo式AI越来越远?
2024-01-16
技术上,ChatGPT要成为 AI医生/AI律师/AI教师 还欠缺哪些能力?
2024-01-11
数学 是且仅是 一种语言和一种工具,不是科学的全部?
2023-12-14
哪些时候用CUDA编程更好?
2023-12-14
用RL做NLP,和 根据那条数据的reward重新标注那条数据 有什么区别?
2022-05-07
没有物理机器人载体,如何在模拟环境里的进行学习和研究机器人?
2022-04-28
2022年了,USB式GPU有哪些进展?
2022-04-28
2022年了,有哪些稳压deepfm的CTR模型?
2022-04-01
CTR模型,如果上线了没效果,这时可以进行哪些分析工作?以及有无必要投入大量时间分析?
2022-03-24
算法工程师如何应对做算法策略的不确定性;比如没效果,这时绩效怎么保证?
2022-03-01
CTR模型必须要有一个测试数据集吗? 训练数据集和测试数据集是同一个,可以吗?
2022-02-25
为啥我感觉现在机器学习模型就是一种模糊匹配工具or相似识别工具?
2022-02-16
因果推断技术靠谱吗,感觉里面的影响因素太多了,所以能实际解决落地问题吗?
2022-02-08
XGB/GBDT/决策树,得出特征重要性的原理是什么?
2022-02-08
强化学习是不是无人驾驶的未来?
2022-02-01
GAN生成图像,弄一个discriminator ,和无D直接生成,区别是?
2022-02-01
哪些互联网公司的管理职级和专业职级是分开的?
2022-01-22
CTR模型的AUC如果比较高,是否其实只是 因为复购行为带来的AUC虚高?
2022-01-17
CTR模型的本质是不是算出 user的哪些特征和item的哪些特征 最匹配?
2022-01-08
人工智能的因果学习(Causal Learning)到底想解决什么问题?
2021-12-17
BYOL里stop-gradient的作用是什么?
2021-12-01
马上2022年了,强化学习+NLP 有了哪些突破?
2021-11-26
马上2022年了,pointer-network现在看来的作用是什么?
2021-11-26
总被主管说文档写的不好怎么办?
2021-11-18
NER任务只有一个类的情况下,BME或者Yes-No的数据预处理方式对结果有影响吗?
2021-11-08
学好数学对于编程的真实增益的性价比到底如何?
2021-11-03
学好数学对于编程的真实增益到底是多少?
2021-11-03
如果说每一个数学公式都在描述一件事情,那么数学公式的推导,是在做什么?
2021-10-26
每个物理公式是否都是在【描述】一个事情?
2021-10-12
求通俗讲讲数学或理论物理进行研究的细节,复杂公式是不是也都是由基础公式而来?
2021-09-14
TA创建的收藏夹 TA关注的收藏夹
TA关注的人