自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

自律 克制 修行 成长

记录自己的问题 以将来自己解答

  • 博客(1696)
  • 资源 (385)
  • 问答 (103)
  • 收藏
  • 关注

原创 pip3 install 报错 protobuf requires Python ‘>=3.7‘ but the running Python is 3.6.8

安装时指定protobuf版本。

2023-01-29 09:15:00 17

原创 编译出 libtensorflow_jni.so

参考 https://github.com/tensorflow/tensorflow/tree/master/tensorflow/java。

2023-01-28 20:19:59 11

原创 编译出 libtensorflow_framework.so

用这个指令在相关根目录搜一下就能搜到,如果你安装了TF的话。

2023-01-28 20:18:24 13

原创 ChatGPT的Reward具体是如何指导Policy的

用KL-loss如图应该就是计算Reward Model生成的句子和Policy Model生成的句子的差值,然后优化这个差值。

2023-01-27 18:41:39 10

原创 memory network 没有成为BERT的基石的原因

transformer在预训练时,靠attention matrix能学到 预训练数据 里两两token之间的关系,也就是所说的上下文关系,然后在fine-tune时会重写 fine-tune数据集 里的两两token之间的关系。memory network 不能学到这些两两token之间的关系。

2023-01-27 18:39:20 20

原创 强化学习用于推荐系统,对比 基于user-item-match的点击率模型

几乎没有提升

2023-01-27 17:19:43 11

原创 多分类问题的one-vs-rest和one-vs-one的是否选择

结论是,其实没有必要用

2023-01-18 17:03:27 37

原创 用户画像里技术是在做什么

用户画像的ground-truth-label

2023-01-16 11:27:24 13

原创 保证标注数据质量的简单有效方法

实际是王道效果

2023-01-14 09:11:58 16

原创 数据分布不均匀,或有重复数据,影响的只是每个数据的学习率

进一步就是相当于 这些重复的数据的学习率大了

2023-01-03 20:24:44 44

原创 CTR模型取日志训练 最大的坑

不是 那个页面 下的所有东西的日志都取!就是要取准确的 那个控件 的点击和曝光,

2023-01-03 20:21:32 31

原创 IDEA的maven配置不生效,还是很多不能import,刷新pom使生效

重新让pom文件刷新生效

2023-01-01 17:49:09 97

原创 跑huggingface/transformers的GPT-2代码

GPT-2

2022-12-26 20:16:02 33

原创 在pycharm里debug以学习huggingface/transformers

github.com/huggingface/transformers

2022-12-26 16:56:54 81

原创 tensorflow tf.where 代码实例

【代码】tensorflow tf.where 实例。

2022-12-23 11:45:29 26

原创 python,image和string的相互转换

python3

2022-12-12 17:09:08 69

原创 MacOS13 python3 报错 mach-o file, but is an incompatible architecture (have ‘arm64‘, need ‘x86_64‘)

pip3 install

2022-12-09 17:38:21 452

原创 tensorflow set contain

contain set

2022-12-05 16:36:35 341

原创 Tensorflow,用tf.while_loop编辑shape为None的tensor的每个值

tf.while_loop

2022-11-30 10:21:57 353

原创 Tensorflow,使用tf.where编辑tensor的每个值

tf.where

2022-11-30 09:02:42 396

原创 Tensorflow,判断两个vector完全相等

tf.math.equal

2022-11-30 08:55:46 29

原创 如果不能搞真的Robot研究,试试把APP看成和用户世界交互的agent。

view App as Robot

2022-11-29 16:08:41 68

原创 PRML学习笔记--似然函数到底是什么

似然函数

2022-11-24 19:56:26 55

原创 Spark 对每个groupby的每个group的string进行concat

concat_ws and collect_set

2022-11-24 11:02:19 482

原创 Spark 报错 no Java class corresponding to Product with Serializable found

spark

2022-11-22 14:54:43 430

原创 MacOS13 安装python3.7 和 tensorflow1.14

python

2022-11-20 20:20:09 407

原创 python3.8运行tensorflow1.14报错 an incompatible architecture (have ‘x86_64‘, need ‘arm64‘)

tensorflow

2022-11-20 20:06:41 138

原创 MacOS13 安装 python3.8.15

python3.8

2022-11-20 18:08:48 269

原创 ERROR: No matching distribution found for tensorflow==1.14.0

python3.9

2022-11-20 17:04:46 1018

原创 Mac 13.0 安装 Python3.6

python3.6

2022-11-20 16:34:21 133

原创 Spark关于.rdd的速度优化

.rdd

2022-11-17 11:13:09 390

原创 Spark,控制输入 group by 的每个group的row数量

limit rows feed for each group

2022-11-03 19:49:39 374

原创 pyspark 报错 StructType can not accept object

pyspark

2022-10-27 10:11:54 75

原创 pyspark 报错 Can not infer schema for type

pyspark

2022-10-26 20:05:36 21

原创 pyspark 报错 Input row doesn‘t have expected number of values required by the schema

pyspark

2022-10-26 19:27:09 53

原创 scala 删除首字符 删除尾字符

注意String和Char不能判断是否相等

2022-10-26 14:15:03 18

原创 spark报错:ClassCastException: cannot assign instance of SerializedLambda to field

spark3

2022-10-20 15:09:54 417

原创 set to set generation

set2set generation

2022-10-19 19:40:38 28

原创 NER问题的验证集,不一定能反映召回率

命名实体识别

2022-10-13 17:22:33 24

原创 报错:package javax.mail does not exist

package javax.mail does not existpackage javax.mail.internet does not existcannot find symbolsymbol: class PasswordAuthenticationsymbol: class Authenticator

2022-09-30 11:22:10 126

MovieLens 20M Dataset

MovieLens 20M movie ratings. Stable benchmark dataset. 20 million ratings and 465,000 tag applications applied to 27,000 movies by 138,000 users. Includes tag genome data with 12 million relevance scores across 1,100 tags. Released 4/2015; updated 10/2016 to update links.csv and add tag genome data.

2022-05-31

MovieLens 25M Dataset

MovieLens 25M movie ratings. Stable benchmark dataset. 25 million ratings and one million tag applications applied to 62,000 movies by 162,000 users. Includes tag genome data with 15 million relevance scores across 1,129 tags. Released 12/2019

2022-05-17

tensorflow 1.14 Mac 系统本地跑需要的dylib

tensorflow 1.14 Mac 系统本地跑需要的dylib

2022-04-20

criteo dataset(CTR数据集)part3

Display Advertising Challenge Predict click-through rates on display ads

2022-03-27

criteo dataset(CTR数据集)part2

Display Advertising Challenge Predict click-through rates on display ads

2022-03-27

criteo dataset(CTR数据集)part1

Display Advertising Challenge Predict click-through rates on display ads

2022-03-27

avazu dataset(CTR数据集)

Predict whether a mobile ad will be clicked

2022-03-27

英文BERT论文预训练数据part2

英文BERT论文原汁预训练数据之一

2021-03-29

英文BERT论文预训练数据part1

英文BERT论文原汁预训练数据之一

2021-03-29

学数学 最好的方法是 做数学

Introduction.pdf

2021-03-16

onnxruntime-1.5.2.zip

https://github.com/microsoft/onnxruntime/releases 方便下载

2020-12-04

onnxruntime-1.5.3.zip

https://github.com/microsoft/onnxruntime/releases 方便下载

2020-12-04

onnxruntime-1.5.2.jar

onnx的java包,pom引入后可以试验java调用onnx文件进行cpu模型推理。 具体见https://github.com/microsoft/onnxruntime/blob/master/java/src/test/java/sample/ScoreMNIST.java 和 https://github.com/microsoft/onnxruntime/blob/master/docs/Java_API.md#getting-started

2020-12-03

train-images-idx3-ubyte.gz 和 train-labels-idx1-ubyte.gz

train-images-idx3-ubyte.gz train-labels-idx1-ubyte.gz t10k-images-idx3-ubyte.gz t10k-labels-idx1-ubyte.gz

2020-12-03

How to write a good CVPR submission

MIT计算机大牛Bill Freeman教授于2014年写的报告,虽然比较久远,但非常有参考意义。How to write a good CVPR submission

2020-11-27

aclImdb_v1.tar.gz

https://huggingface.co/transformers/custom_datasets.html#seq-imdb 用到的数据

2020-11-19

tensorflow_gpu-1.15.3-cp36-cp36m-manylinux2010_x86_64.whl

An Open Source Machine Learning Framework for Everyone

2020-11-06

tensorflow_gpu-1.15.2-cp36-cp36m-manylinux2010_x86_64.whl

An Open Source Machine Learning Framework for Everyone

2020-11-06

tensorflow_gpu-1.15.0-cp36-cp36m-manylinux2010_x86_64.whl

An Open Source Machine Learning Framework for Everyone

2020-11-06

tensorflow_gpu-1.15.4-cp36-cp36m-manylinux2010_x86_64.whl

An Open Source Machine Learning Framework for Everyone

2020-11-06

tensorflow-1.14.0-cp36-cp36m-macosx_10_11_x86_64.whl

tensorflow 离线安装包 An Open Source Machine Learning Framework for Everyone

2020-10-27

tensorflow-2.3.0-cp36-cp36m-macosx_10_11_x86_64.whl

tensorflow 离线安装包 An Open Source Machine Learning Framework for Everyone

2020-10-27

annotated_wikisql_and_PyTorch_bert_param.zip

自然语言转SQL的SOTA项目https://github.com/guotong1988/NL2SQL-RULE 的完整数据

2020-10-22

annotated_wikisql_and_PyTorch_bert_param.zip

自然语言转SQL任务 https://github.com/guotong1988/NL2SQL-RULE 用的数据

2020-10-19

NeurIPS上讲解XLNet的PPT

An auto-regressive model that captures bidirectional context

2020-09-29

XLNet的预训练模型 cased_L-12_H-768_A-12.zip

XLNet的预训练好的模型文件,来自 https://github.com/zihangdai/xlnet

2020-09-28

CLUE打包后1G的中文预训练数据

用于BERT预训练,Bidirectional Encoder Representation from Transformers

2020-07-11

14G的中文预训练数据part1

用于BERT预训练,Bidirectional Encoder Representation from Transformers

2020-07-10

14G的中文预训练数据part3

用于BERT预训练,Bidirectional Encoder Representation from Transformers

2020-07-10

14G的中文预训练数据part2

用于BERT预训练,Bidirectional Encoder Representation from Transformers

2020-07-10

维基百科中文预训练数据

用于BERT预训练,Bidirectional Encoder Representation from Transformers

2020-07-10

中文三元组数据,可用于爬虫种子

用于BERT预训练,Bidirectional Encoder Representation from Transformers

2020-07-10

glove.42B.300d 词向量

著名的glove词向量,上Billion个词,每个词N维,可用于深度模型初始化,BERT之后仍有其价值

2020-07-06

glove.840B.300d 词向量

著名的glove词向量,上Billion个词,每个词N维,可用于深度模型初始化,BERT之后仍有其价值

2020-07-06

fasttext词向量,中文

著名的fasttext词向量,上Billion个词,每个词N维,可用于深度模型初始化,BERT之后仍有其价值

2020-07-06

大规模新闻文本分类数据集

大规模新闻文本分类数据集,有多个领域,按文件夹摆放,不仅可以用来做文本分类实验,数据不少甚至可以用来做BERT预训练

2020-07-01

resnet50-19c8e357.pth.zip

mmdetection里用的预训练模型resnet的,放在AWS上的,国内下载不便,放在CSDN方便大家下载

2020-06-22

resnext101_64x4d-ee2c6f71.pth

mmdetection里用的预训练模型resnext的,放在AWS上的,国内下载不便,放在CSDN方便大家下载

2020-06-22

chinese_L-12_H-768_A-12.zip

https://github.com/google-research/bert 里的预训练好的模型,中文的

2020-06-21

cuda_10.0.130_410.48_linux.run

cuda10 CentOS7 Linux runfile 安装文件,网速慢的用户用, 安装前要先禁用nouveau,

2020-06-21

MetaLearning是LearnToLearn,那如何解决LearnToLearnToLearn?

2022-05-24

随AlexNet兴起的 深度学习 是否 还是总体处在 模式识别 的框架下?

2022-05-15

BERT/GPT是 精确存储了所有每句话的“语义” 还是得出每句话的少数服从多数的统计“语义”?

2022-05-09

用RL做NLP,和 根据那条数据的reward重新标注那条数据 有什么区别?

2022-05-07

没有物理机器人载体,如何在模拟环境里的进行学习和研究机器人?

2022-04-28

2022年了,USB式GPU有哪些进展?

2022-04-28

2022年了,有哪些稳压deepfm的CTR模型?

2022-04-01

CTR模型,如果上线了没效果,这时可以进行哪些分析工作?以及有无必要投入大量时间分析?

2022-03-24

算法工程师如何应对做算法策略的不确定性;比如没效果,这时绩效怎么保证?

2022-03-01

CTR模型必须要有一个测试数据集吗? 训练数据集和测试数据集是同一个,可以吗?

2022-02-25

有人搞过离线CTR模型么,缓存每个user对每个item的打分,没缓存的item默认处理,靠谱吗?

2022-02-18

把user买过的item的名字embedding后作为特征,以及item本身的名字embedding作为特征,这两个特征加到CTR模型,会有效果吧?

2022-02-16

为啥我感觉现在机器学习模型就是一种模糊匹配工具or相似识别工具?

2022-02-16

因果推断技术靠谱吗,感觉里面的影响因素太多了,所以能实际解决落地问题吗?

2022-02-08

XGB/GBDT/决策树,得出特征重要性的原理是什么?

2022-02-08

强化学习是不是无人驾驶的未来?

2022-02-01

GAN生成图像,弄一个discriminator ,和无D直接生成,区别是?

2022-02-01

哪些互联网公司的管理职级和专业职级是分开的?

2022-01-22

CTR模型的AUC如果比较高,是否其实只是 因为复购行为带来的AUC虚高?

2022-01-17

CTR模型的本质是不是算出 user的哪些特征和item的哪些特征 最匹配?

2022-01-08

人工智能的因果学习(Causal Learning)到底想解决什么问题?

2021-12-17

BYOL里stop-gradient的作用是什么?

2021-12-01

马上2022年了,强化学习+NLP 有了哪些突破?

2021-11-26

马上2022年了,pointer-network现在看来的作用是什么?

2021-11-26

总被主管说文档写的不好怎么办?

2021-11-18

NER任务只有一个类的情况下,BME或者Yes-No的数据预处理方式对结果有影响吗?

2021-11-08

为什么机器翻译文本生成,至今仍然在用transformer-auto-regressive的别扭架构?

2021-11-08

Float特征直接输入deepCTR模型和分桶转成int再embedding输入的区别是?

2021-11-08

学好数学对于编程的真实增益的性价比到底如何?

2021-11-03

学好数学对于编程的真实增益到底是多少?

2021-11-03

如果说每一个数学公式都在描述一件事情,那么数学公式的推导,是在做什么?

2021-10-26

研究出 通用人工智能/曲率引擎/黎曼猜想/可控核聚变/零事故飞行汽车/量子计算机/治愈癌症 的难度排名?

2021-10-20

每个物理公式是否都是在【描述】一个事情?

2021-10-12

求通俗讲讲数学或理论物理进行研究的细节,复杂公式是不是也都是由基础公式而来?

2021-09-14

基于对比学习(Contrastive Learning)的文本表示模型【为什么】能学到语义【相似】度?

2021-08-17

为什么CV能做到让一幅人脸图动了笑了,而NLP的text-style-transfer进展貌似一般?

2021-08-05

现在看来self-attention 是增强了模型表示能力,还是有了更好的对特征的权重加权?

2021-08-05

GAN的瓶颈其实在于判别器(Discriminator)吗?

2021-08-05

GAN的判别器(Discriminator)为什么能自己逐步提升?

2021-08-04

优化 Spark group-by 时 key【过多】有什么办法?

2021-07-21

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除