自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Talk Is Cheap

If You Get Tired, Learn To Rest, Not To Quit.

  • 博客(18)
  • 资源 (385)
  • 问答 (103)
  • 收藏
  • 关注

原创 销量等大数值特征输入深度模型

一个特征的值如果是 100000、150000 这样的,怎么输入到模型里?比如这个特征就是销量?决策树直接输入,普通模型做下上下界截断然后做一些log或者sqrt的处理,大模型可以离散化,直接int离散化或者做log后离散化都行...

2020-04-29 17:23:47 273

原创 TensorFlow 的KL divergence的实现

def kl_for_log_probs(log_p, log_q): p = tf.exp(log_p) neg_ent = tf.reduce_sum(p * log_p, axis=-1) neg_cross_ent = tf.reduce_sum(p * log_q, axis=-1) kl = neg_ent - neg_cross_ent ret...

2020-04-28 19:17:08 3185

原创 Differentiable Reasoning over a Virtual Knowledge Base 代码

https://github.com/google-research/language/tree/master/language/labs/drkit

2020-04-28 16:28:49 402

原创 AutoPhrase 阅读笔记

论文名:Automated Phrase Mining from Massive Text Corpora摘要本文研究关键短语提取,研究无监督的,使用了通用知识库信息来做,使用了词性信息提升效果,引言Phrase mining的意思是短语(实体、关键词)提取,本文贡献:使用通用知识库的来构造正样本(应该就是用完全匹配的方式),然后训练一个分类器,然后用这个分类器的预测结果来减少负样本噪...

2020-04-28 15:25:52 3102

原创 BERT加速,BERT inference加速,BERT实用加速

从头预训练一个针对的那1个任务的3层BERT,保持预训练和inference时的一致性,速度加速4倍,精度不变。

2020-04-28 10:24:33 1195 2

原创 spark 2.2 只有1个worker在跑

partitions数量没设置,dataframe.repartition(100)

2020-04-27 14:42:14 896

原创 gitignore 刷新

https://stackoverflow.com/questions/38450276/force-git-to-update-gitignore

2020-04-15 17:03:39 343

原创 tensorflow 一个模型两个学习率

tvars = tf.trainable_variables()var_list1 = [var for var in tvars if "bert" in var.name]var_list2 = [var for var in tvars if "bert" not in var.name]opt1 = tf.train.GradientDescentOptimizer(0.00001)...

2020-04-15 15:43:33 399

原创 spark,在左表右表都有重复数据的情况下,left join之后数据数量等于左表

给左表人工加一个id列,最后按这个id列distinct就行了。

2020-04-14 13:51:46 1194

原创 spark groupby之后再展开 实例

import org.apache.spark.sql.{Row, SparkSession}object Test { def main(args: Array[String]): Unit = { val spark = SparkSession.builder.appName("Simple Application").enableHiveSupport().getOrC...

2020-04-14 12:27:48 971

原创 imdb、SST-1、SST-2、yelp-2013、yelp-2014 文本分类数据集

https://github.com/JerrikEph/Capsule4TextClassification/blob/master/data/downloadDataset.md

2020-04-10 15:25:36 4687

原创 短文本分类数据集(英文)

https://opendata.stackexchange.com/questions/6080/data-sets-for-short-text-classification

2020-04-10 13:15:33 2105 2

原创 pycharm debug F8 slow / variable not show

Preference --> python debugger --> Gevent compatible勾选后重跑

2020-04-10 11:21:59 228 1

原创 tensorflow 构造对角线为0的矩阵,并mask

import tensorflow as tfsess = tf.Session()input = tf.ones([2,3,3])*2mask1 = tf.ones([3,3])mask2 = tf.diag(tf.ones([3]))mask = mask1 - mask2print(sess.run(mask))print(sess.run(input * mask))...

2020-04-09 11:47:14 1102

原创 tensorflow 构造对角线为1的矩阵,并mask

import tensorflow as tfsess = tf.Session()input = tf.ones([2,3,3])*2mask = tf.diag(tf.ones([3]))print(sess.run(mask))print(sess.run(input * mask))print结果:[[1. 0. 0.][0. 1. 0.][0. 0. 1.]][...

2020-04-09 11:40:26 2847

原创 ICLR 2020 ENERGY BASED MODEL 摘要速览

YOUR CLASSIFIER IS SECRETLY AN ENERGY BASEDMODEL AND YOU SHOULD TREAT IT LIKE ONEhttps://openreview.net/group?id=ICLR.cc/2020/Conference#accept-talk引言discriminative分类器表示为 p(y|x),可以基于能量型模型 把它重新推导成...

2020-04-09 10:38:24 511

原创 矩阵分解的一些理解

attention matrix 是一个 [batch_size, sequence_len1, hidden_size] 的tensor和一个[batch_size, sequence_len2, hidden_size] 的tensor得到的[batch_size, sequence_len1, sequence_len2] 的tensor,反过来其实就是一个矩阵分解操作,[seque...

2020-04-03 15:01:26 343

原创 Structural Deep Clustering Network 摘要速览

https://arxiv.org/pdf/2002.01633.pdfClustering is a fundamental task in data analysis. Recently, deepclustering, which derives inspiration primarily from deep learningapproaches, achieves state-of-...

2020-04-01 10:31:38 747

stanford-corenlp-4.5.6.zip

https://nlp.stanford.edu/software/stanford-corenlp-4.5.6.zip

2024-03-12

huggingface的bert-base-chinese

https://huggingface.co/google-bert/bert-base-chinese pytorch和tensorflow都有

2024-03-05

huggingface的bert-base-uncased

https://huggingface.co/google-bert/bert-base-uncased pytorch和tensorflow都有

2024-03-03

TREC-6 文本分类数据集

https://www.tensorflow.org/datasets/catalog/trec

2024-02-22

chatglm3-6b的模型参数文件0/7

这个是除了7个大文件之外的所有小文件

2023-11-30

chatglm3-6b的模型参数文件6/7

chatglm3-6b的模型参数文件6/7

2023-11-29

chatglm3-6b的模型参数文件5/7

chatglm3-6b的模型参数文件5/7

2023-11-29

chatglm3-6b的模型参数文件4/7

chatglm3-6b的模型参数文件4/7

2023-11-29

chatglm3-6b的模型参数文件7/7

chatglm3-6b的模型参数文件7/7

2023-11-28

chatglm3-6b的模型参数文件3/7

chatglm3-6b的模型参数文件3/7

2023-11-28

chatglm3-6b的模型参数文件2/7

chatglm3-6b的模型参数文件2/7

2023-11-28

chatglm3-6b的模型参数文件1/7

chatglm3-6b的模型参数文件1/7

2023-11-28

Deep (Convolution) Networks from First Principles by马毅老师

Deep (Convolution) Networks from First Principles by马毅老师

2023-09-26

NLPIR新闻语料库(2400万字)

1.解压缩后数据量为48MB,大约2400万字的新闻; 2.采集的新闻时间跨度为2009年10月12日至2009年12月14日。 3.文件名为新闻的时间;每个文件包括多个新闻正文内容(已经去除了新闻的垃圾信息); 4.新闻本身内容的版权属于原作者或者新闻机构; 5.整理后的语料库版权属于www.NLPIR.org; 6.可供新闻分析、自然语言处理、搜索等应用提供测试数据场景; 如需更大规模的语料库,可以联系NLPIR.org管理员。

2023-08-30

CLUE AFQMC 语义相似度 数据集

蚂蚁金融语义相似度 Ant Financial Question Matching Corpus 数据量:训练集(34334)验证集(4316)测试集(3861)

2023-07-24

CLUE TNEWS 文本分类数据集

今日头条中文新闻(短文本)分类 Short Text Classificaiton for News 数据量:训练集(53,360),验证集(10,000),测试集(10,000)

2023-07-24

Linux-CentOS编译好的python3.8,解决了ssl相关问题

Linux-CentOS编译好的python3.8,解决了ssl相关问题

2023-02-17

MovieLens 20M Dataset

MovieLens 20M movie ratings. Stable benchmark dataset. 20 million ratings and 465,000 tag applications applied to 27,000 movies by 138,000 users. Includes tag genome data with 12 million relevance scores across 1,100 tags. Released 4/2015; updated 10/2016 to update links.csv and add tag genome data.

2022-05-31

MovieLens 25M Dataset

MovieLens 25M movie ratings. Stable benchmark dataset. 25 million ratings and one million tag applications applied to 62,000 movies by 162,000 users. Includes tag genome data with 15 million relevance scores across 1,129 tags. Released 12/2019

2022-05-17

tensorflow 1.14 Mac 系统本地跑需要的dylib

tensorflow 1.14 Mac 系统本地跑需要的dylib

2022-04-20

criteo dataset(CTR数据集)part3

Display Advertising Challenge Predict click-through rates on display ads

2022-03-27

criteo dataset(CTR数据集)part2

Display Advertising Challenge Predict click-through rates on display ads

2022-03-27

criteo dataset(CTR数据集)part1

Display Advertising Challenge Predict click-through rates on display ads

2022-03-27

avazu dataset(CTR数据集)

Predict whether a mobile ad will be clicked

2022-03-27

英文BERT论文预训练数据part2

英文BERT论文原汁预训练数据之一

2021-03-29

英文BERT论文预训练数据part1

英文BERT论文原汁预训练数据之一

2021-03-29

学数学 最好的方法是 做数学

Introduction.pdf

2021-03-16

onnxruntime-1.5.2.zip

https://github.com/microsoft/onnxruntime/releases 方便下载

2020-12-04

onnxruntime-1.5.3.zip

https://github.com/microsoft/onnxruntime/releases 方便下载

2020-12-04

onnxruntime-1.5.2.jar

onnx的java包,pom引入后可以试验java调用onnx文件进行cpu模型推理。 具体见https://github.com/microsoft/onnxruntime/blob/master/java/src/test/java/sample/ScoreMNIST.java 和 https://github.com/microsoft/onnxruntime/blob/master/docs/Java_API.md#getting-started

2020-12-03

train-images-idx3-ubyte.gz 和 train-labels-idx1-ubyte.gz

train-images-idx3-ubyte.gz train-labels-idx1-ubyte.gz t10k-images-idx3-ubyte.gz t10k-labels-idx1-ubyte.gz

2020-12-03

How to write a good CVPR submission

MIT计算机大牛Bill Freeman教授于2014年写的报告,虽然比较久远,但非常有参考意义。How to write a good CVPR submission

2020-11-27

aclImdb_v1.tar.gz

https://huggingface.co/transformers/custom_datasets.html#seq-imdb 用到的数据

2020-11-19

tensorflow_gpu-1.15.3-cp36-cp36m-manylinux2010_x86_64.whl

An Open Source Machine Learning Framework for Everyone

2020-11-06

tensorflow_gpu-1.15.2-cp36-cp36m-manylinux2010_x86_64.whl

An Open Source Machine Learning Framework for Everyone

2020-11-06

tensorflow_gpu-1.15.0-cp36-cp36m-manylinux2010_x86_64.whl

An Open Source Machine Learning Framework for Everyone

2020-11-06

tensorflow_gpu-1.15.4-cp36-cp36m-manylinux2010_x86_64.whl

An Open Source Machine Learning Framework for Everyone

2020-11-06

tensorflow-1.14.0-cp36-cp36m-macosx_10_11_x86_64.whl

tensorflow 离线安装包 An Open Source Machine Learning Framework for Everyone

2020-10-27

tensorflow-2.3.0-cp36-cp36m-macosx_10_11_x86_64.whl

tensorflow 离线安装包 An Open Source Machine Learning Framework for Everyone

2020-10-27

annotated_wikisql_and_PyTorch_bert_param.zip

自然语言转SQL的SOTA项目https://github.com/guotong1988/NL2SQL-RULE 的完整数据

2020-10-22

自动驾驶,如何得到方向盘转动的ground truth?

2024-03-18

AlphaGo能超越人类,因为训练时 对于模型的每个输入,都有一个100%正确的答案?

2024-01-16

其实LLM/ChatGPT是否在距离AlphaGo式AI越来越远?

2024-01-16

技术上,ChatGPT要成为 AI医生/AI律师/AI教师 还欠缺哪些能力?

2024-01-11

数学 是且仅是 一种语言和一种工具,不是科学的全部?

2023-12-14

哪些时候用CUDA编程更好?

2023-12-14

MetaLearning是LearnToLearn,那如何解决LearnToLearnToLearn?

2022-05-24

BERT/GPT是 精确存储了所有每句话的“语义” 还是得出每句话的少数服从多数的统计“语义”?

2022-05-09

用RL做NLP,和 根据那条数据的reward重新标注那条数据 有什么区别?

2022-05-07

没有物理机器人载体,如何在模拟环境里的进行学习和研究机器人?

2022-04-28

2022年了,USB式GPU有哪些进展?

2022-04-28

2022年了,有哪些稳压deepfm的CTR模型?

2022-04-01

CTR模型,如果上线了没效果,这时可以进行哪些分析工作?以及有无必要投入大量时间分析?

2022-03-24

算法工程师如何应对做算法策略的不确定性;比如没效果,这时绩效怎么保证?

2022-03-01

CTR模型必须要有一个测试数据集吗? 训练数据集和测试数据集是同一个,可以吗?

2022-02-25

有人搞过离线CTR模型么,缓存每个user对每个item的打分,没缓存的item默认处理,靠谱吗?

2022-02-18

把user买过的item的名字embedding后作为特征,以及item本身的名字embedding作为特征,这两个特征加到CTR模型,会有效果吧?

2022-02-16

为啥我感觉现在机器学习模型就是一种模糊匹配工具or相似识别工具?

2022-02-16

因果推断技术靠谱吗,感觉里面的影响因素太多了,所以能实际解决落地问题吗?

2022-02-08

XGB/GBDT/决策树,得出特征重要性的原理是什么?

2022-02-08

强化学习是不是无人驾驶的未来?

2022-02-01

GAN生成图像,弄一个discriminator ,和无D直接生成,区别是?

2022-02-01

哪些互联网公司的管理职级和专业职级是分开的?

2022-01-22

CTR模型的AUC如果比较高,是否其实只是 因为复购行为带来的AUC虚高?

2022-01-17

CTR模型的本质是不是算出 user的哪些特征和item的哪些特征 最匹配?

2022-01-08

人工智能的因果学习(Causal Learning)到底想解决什么问题?

2021-12-17

BYOL里stop-gradient的作用是什么?

2021-12-01

马上2022年了,强化学习+NLP 有了哪些突破?

2021-11-26

马上2022年了,pointer-network现在看来的作用是什么?

2021-11-26

总被主管说文档写的不好怎么办?

2021-11-18

NER任务只有一个类的情况下,BME或者Yes-No的数据预处理方式对结果有影响吗?

2021-11-08

为什么机器翻译文本生成,至今仍然在用transformer-auto-regressive的别扭架构?

2021-11-08

Float特征直接输入deepCTR模型和分桶转成int再embedding输入的区别是?

2021-11-08

学好数学对于编程的真实增益的性价比到底如何?

2021-11-03

学好数学对于编程的真实增益到底是多少?

2021-11-03

如果说每一个数学公式都在描述一件事情,那么数学公式的推导,是在做什么?

2021-10-26

研究出 通用人工智能/曲率引擎/黎曼猜想/可控核聚变/零事故飞行汽车/量子计算机/治愈癌症 的难度排名?

2021-10-20

每个物理公式是否都是在【描述】一个事情?

2021-10-12

求通俗讲讲数学或理论物理进行研究的细节,复杂公式是不是也都是由基础公式而来?

2021-09-14

基于对比学习(Contrastive Learning)的文本表示模型【为什么】能学到语义【相似】度?

2021-08-17

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除