自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 资源 (380)
  • 论坛 (88)
  • 问答 (47)
  • 收藏
  • 关注

原创 Jeff Dean

http://research.google.com/people/jeff/

2013-12-26 10:53:59 796

原创 mysql 自动安装版 最新下载地址

http://dev.mysql.com/downloads/installer/

2013-12-04 13:36:23 818

原创 javaparser, Java 1.5 Parser and AST

https://code.google.com/p/javaparser/

2013-12-03 15:23:07 2556

大规模新闻文本分类数据集

大规模新闻文本分类数据集,有多个领域,按文件夹摆放,不仅可以用来做文本分类实验,数据不少甚至可以用来做BERT预训练

2020-07-01

知乎文本分类竞赛 数据集2/2

https://biendata.com/competition/zhihu/ 参赛者需要根据知乎给出的问题及话题标签的绑定关系的训练数据,训练出对未标注数据自动标注的模型。 标注数据中包含 300 万个问题,每个问题有 1 个或多个标签,共计1999 个标签。每个标签对应知乎上的一个「话题」

2018-07-16

chinese_L-12_H-768_A-12.zip

https://github.com/google-research/bert 里的预训练好的模型,中文的

2020-06-21

_bz2.cpython-36m-x86_64-linux-gnu.so

Python3.6的bz2模块需要的so文件,可复制到lib/python3.6/lib-dynload使用

2017-10-30

NLTK wordnet.zip

id: wordnet; size: 10775600; author: ; copyright: WordNet 3.0 Copyright 2006 by Princeton University. All rights reserved.; license: Permission to use, copy, modify and distribute this software and database and its documentation for any purpose and without fee or royalty is hereby granted, provided that you agree to comply with the following copyright notice and statements, including the disclaimer, and that the same appear on ALL copies of the software, database and documentation, including modifications that you make for internal use or for distribution.... [see webpage for full license];

2019-12-01

WebQuestionsSP数据集

WebQuestions Semantic Parses Dataset The WebQuestionsSP dataset is released as part of our ACL-2016 paper “The Value of Semantic Parse Labeling for Knowledge Base Question Answering” [Yih, Richardson, Meek, Chang & Suh, 2016], in which we evaluated the value of gathering semantic parses, vs. answers, for a set of questions that originally comes from WebQuestions [Berant et al., 2013].

2018-02-28

torch-1.5.0+cu101-cp36-cp36m-linux_x86_64.whl

https://download.pytorch.org/whl/torch_stable.html 这里下载的pytorch安装文件,网速慢的用户用

2020-06-21

train-images-idx3-ubyte.gz 和 train-labels-idx1-ubyte.gz

train-images-idx3-ubyte.gz train-labels-idx1-ubyte.gz t10k-images-idx3-ubyte.gz t10k-labels-idx1-ubyte.gz

2020-12-03

bochs-2.6.2 .tar.gz

bochs-2.6.2 .tar.gz

2013-06-14

glove.6B.50d数据

glove.6B.50d数据

2017-08-01

nlpcc 2018 知识图谱 数据集

Task 7 - Open Domain Question Answering In this year’s NLPCC open domain QA share task, we focus on KNOWLEDGE and propose three sub-tasks, including (a) knowledge-based question answering (KBQA), (b) knowledge-based question generation (KBQG), and (c) knowledge-based question understanding (KBQU). The task of KBQA is to answer natural language questions based on a given knowledge base. The task of KBQG is to generate natural language questions based on given knowledge base triples. The task of KBQU is to transform natural language questions into their corresponding logical forms. The first two sub-tasks are in Chinese, while the last sub-task is in English.

2018-03-28

NLPCC 2018 知识图谱 测试数据 带答案

训练数据在这里https://download.csdn.net/download/guotong1988/10313309

2018-05-17

NLTK sentiwordnet.zip

id: sentiwordnet; size: 4686546; author: Stefano Baccianella, Andrea Esuli, and Fabrizio Sebastiani; copyright: Copyright (C) 2013 SentiWordNet Project; license: Creative Commons Attribution ShareAlike 3.0 Unported license;

2019-12-01

XLNet的预训练模型 cased_L-12_H-768_A-12.zip

XLNet的预训练好的模型文件,来自 https://github.com/zihangdai/xlnet

2020-09-28

libcudnn.so.7

cudnn-9.0-linux-x64-v7.tgz cuda9深度学习必备啊啊啊啊啊

2018-03-06

FB15K 数据集

用在此处 https://github.com/thunlp/OpenKE For training, datasets contain three files: train2id.txt: training file, the first line is the number of triples for training. Then the follow lines are all in the format (e1, e2, rel). entity2id.txt: all entities and corresponding ids, one per line. The first line is the number of entities. relation2id.txt: all relations and corresponding ids, one per line. The first line is the number of relations. For testing, datasets contain additional two files (totally five files): test2id.txt: testing file, the first line is the number of triples for testing. Then the follow lines are all in the format (e1, e2, rel). valid2id.txt: validating file, the first line is the number of triples for validating. Then the follow lines are all in the format (e1, e2, rel).

2018-03-02

quora_duplicate_questions.tsv

quora pairs 一个数据集,判断两个句子是否表达同样的意思

2018-05-29

机器翻译WMT14数据集

机器翻译WMT14数据集,ACL2014公布的share task,很多模型都在这上benchmark

2018-04-09

resnet50-19c8e357.pth.zip

mmdetection里用的预训练模型resnet的,放在AWS上的,国内下载不便,放在CSDN方便大家下载

2020-06-22

libcublas.so.9.0

错误:ImportError: libcublas.so.9.0: cannot open shared object file: No such file or directory cudnn-9.0-linux-x64-v7.1

2018-05-29

金庸全集UTF-8编码TXT格式训练集

简单清洗过的金庸全集TXT格式,可做语言模型的训练集,

2019-03-13

An Architecture for Fast and General Data Processing on Large Clusters

马铁(Matei Zaharia)的博士论文:An Architecture for Fast and General Data Processing on Large Clusters。此人在Berkeley的PhD六年,从Hadoop上最常用的调度算法(fair),到集群资源管理(Mesos),到大数据上最热门的Spark,建树之广,影响之大,史上罕见,是超神级的人物

2014-02-12

cuda_10.0.130_410.48_linux.run

cuda10 CentOS7 Linux runfile 安装文件,网速慢的用户用, 安装前要先禁用nouveau,

2020-06-21

NELL-995 知识图谱 数据集

Format of the dataset raw.kb: the raw kb data from NELL system kb_env_rl.txt: we add inverse triples of all triples in raw.kb, this file is used as the KG for reasoning entity2vec.bern/relation2vec.bern: transE embeddings to represent out RL states, can be trained using TransX implementations by thunlp tasks/: each task is a particular reasoning relation tasks/${relation}/*.vec: trained TransH Embeddings tasks/${relation}/*.vec_D: trained TransD Embeddings tasks/${relation}/*.bern: trained TransR Embedding trained tasks/${relation}/*.unif: trained TransE Embeddings tasks/${relation}/transX: triples used to train the KB embeddings tasks/${relation}/train.pairs: train triples in the PRA format tasks/${relation}/test.pairs: test triples in the PRA format tasks/${relation}/path_to_use.txt: reasoning paths found the RL agent tasks/${relation}/path_stats.txt: path frequency of randomised BFS

2018-03-28

标准的quora数据集

标准的quora pairs数据集,判断两句话是否同义,BiMPM得分ACC88,

2018-11-27

cityscapes数据集

cityscapes数据集,pix2pix模型用的。 Semantic, instance-wise, dense pixel annotations of 30 classes

2019-04-08

DBeaver数据库管理工具

数据库管理工具

2014-09-24

Python-3.6.8.tgz

Python-3.6.8源码安装包 ./configure --prefix=/your_path make make install

2019-12-16

scipy-0.18.1-cp35-cp35m-win_amd64.whl

scipy-0.18.1-cp35-cp35m-win_amd64.whl

2016-12-21

_sqlite3.cpython-36m-x86_64-linux-gnu.so

Python 3.6的sqlite3的so文件,放到lib/python3.6/lib-dynload解决No module named '_sqlite3'问题

2018-05-29

scipy-0.19.0-cp27-cp27mu-manylinux1_x86_64.whl

scipy-0.19.0-cp27-cp27mu-manylinux1_x86_64.whl

2017-03-10

lda2vec ppt

The lda2vec model tries to mix the best parts of word2vec and LDA into a single framework. word2vec captures powerful relationships between words, but the resulting vectors are largely uninterpretable and don't represent documents. LDA on the other hand is quite interpretable by humans, but doesn't model local word relationships like word2vec. We build a model that builds both word and document topics, makes them interpreable, makes topics over clients, times, and documents, and makes them supervised topics.

2019-07-26

glove.840B.300d 词向量

著名的glove词向量,上Billion个词,每个词N维,可用于深度模型初始化,BERT之后仍有其价值

2020-07-06

一篇讲蒙特卡罗树搜索的文档

A Survey of Monte Carlo Tree Search Methods

2017-08-04

freedos.img

用bochs可boot的

2013-11-06

MSMARCO-Passage-Ranking的top1000.dev.tar.gz

https://github.com/microsoft/MSMARCO-Passage-Ranking

2019-08-09

aclImdb_v1.tar.gz

https://huggingface.co/transformers/custom_datasets.html#seq-imdb 用到的数据

2020-11-19

freebase-FB2M数据

freebase-FB2M数据 freebase-FB2M数据 freebase-FB2M数据

2017-06-19

onnxruntime-1.5.2.zip

https://github.com/microsoft/onnxruntime/releases 方便下载

2020-12-04

wikitext 103 数据集

The WikiText language modeling dataset is a collection of over 100 million tokens extracted from the set of verified Good and Featured articles on Wikipedia.

2019-02-21

编译时 java -d 是什么意思?

发表于 2011-01-20 最后回复 2020-03-26

android 怎么输出变量的的值到log

发表于 2011-06-09 最后回复 2020-03-12

guotong1988的留言板

发表于 2020-01-02 最后回复 2020-01-02

请问linux里的 # 和 $ 都有什么意思啊?

发表于 2011-01-24 最后回复 2018-06-19

问下付费VIP能扩大上传资源权限到500M吗

发表于 2017-12-04 最后回复 2017-12-04

怎么用html里的button里的onclick的运行一段java

发表于 2011-02-23 最后回复 2017-09-30

linux里面有很多goto,为什么明确不提倡用goto

发表于 2012-01-14 最后回复 2017-08-05

华为手机的AI部门 和 联想的AI部门 去哪个

发表于 2016-11-20 最后回复 2016-11-21

做AI的话是搞 底层框架大牛 和 应用层业务大牛 哪个有前途?

发表于 2016-11-20 最后回复 2016-11-21

什么情况下用plsql?

发表于 2015-03-12 最后回复 2016-10-26

为什么我是博客专家了还是不能把微博搞上

发表于 2016-01-25 最后回复 2016-01-28

创业公司老板兼CTO把我们看成打杂的怎么办???

发表于 2014-11-14 最后回复 2016-01-15

一段scala代码读不懂。。。

发表于 2015-03-02 最后回复 2015-04-22

jsp问题,入门级,求助啊!!! 搜遍了网上方法,(附图)

发表于 2015-03-18 最后回复 2015-03-24

Java 线程共用run方法里的代码段吗?

发表于 2014-11-24 最后回复 2015-03-02

为什么列式数据库适用于OLAP,行式数据库适用于OLTP?

发表于 2014-10-18 最后回复 2015-03-02

问下搞机器学习的童鞋,都用什么数据库,还是不用数据库?

发表于 2015-02-05 最后回复 2015-03-02

如何把 linux0.11更高的版本 用bochs编译并运行

发表于 2014-12-23 最后回复 2015-03-02

小弟今年27了,该不该跳这个槽,明天给那边回复

发表于 2015-02-01 最后回复 2015-03-02

有多少人和我一样觉得老板兼CTO从不考虑员工所想的

发表于 2014-11-11 最后回复 2015-01-04

从mysql、oracle、sqlserver、db2里取数据,怎样取最快?

发表于 2014-11-12 最后回复 2014-11-19

世界上有哪些非计算机专业出身的IT精英?

发表于 2014-11-09 最后回复 2014-11-11

求推荐一款优秀的开源的数据库管理工具,可以支持mysql、oracle、sqlserver、db2等。

发表于 2014-11-06 最后回复 2014-11-09

the import com.mysql can not be resolved 请问

发表于 2011-02-21 最后回复 2014-10-31

怎么把 指针b的指向的地址作为值 放到指针a指向的地址里?

发表于 2014-10-19 最后回复 2014-10-19

Java,我有一个外网IP比如7.7.7.7:port的server,想和一内网192.168.0.13client通信,server端求个java小例子

发表于 2013-08-27 最后回复 2014-10-18

windows核心编程 看不懂

发表于 2012-02-25 最后回复 2014-03-14

各位大侠,什么书有讲C++多线程的知识?

发表于 2012-02-20 最后回复 2013-08-27

各位大侠,什么书里有讲P,V操作的?

发表于 2012-03-04 最后回复 2013-08-27

as3 addchild() 的机制????????

发表于 2011-09-05 最后回复 2013-07-28

如何实现比如五子棋的联机对战,在iphone上,主要是网络编程方面

发表于 2011-06-10 最后回复 2012-11-23

谁帮我详细解释下这句: <script type="text/javascript">

发表于 2011-02-21 最后回复 2012-09-20

比如做一个 绑定IE首页的程序 需要什么知识?看什么书?

发表于 2012-02-19 最后回复 2012-02-20

做游戏 美工 和 程序 可否都学?

发表于 2012-02-16 最后回复 2012-02-19

各位大侠 想做游戏 程序 和 美工 可不可以都学?

发表于 2012-02-16 最后回复 2012-02-19

哪里可以做业余项目?

发表于 2012-02-05 最后回复 2012-02-16

大家怎么看 程序实现 和 更好的实现 这件事?

发表于 2011-11-01 最后回复 2012-01-20

大家怎么看 程序功能实现 和 更好的实现 这件事?

发表于 2011-11-01 最后回复 2011-11-11

android的调试速度怎么这么慢

发表于 2011-10-28 最后回复 2011-11-01

大家怎么看 实现 与 更好的实现 这件事???????

发表于 2011-10-28 最后回复 2011-11-01

有没有一些在java+cpu训练机器学习模型的方案?

2021-05-11

我们代码里的learning rate是一个batch总的学习率还是一个data的学习率?

2021-04-28

有没有办法在map里面得到Spark的worker信息,然后固定仅让那一个worker输出日志?

2021-04-15

2021年了,主流神经网络是不是可以说就是transformer、RNN、CNN三种基础模块了?

2021-03-26

所谓的RNN不能并行到底指的什么?

2021-03-26

除了#TODO在pycharm还有哪些高亮的注释?

2021-03-26

问下有人知道和BERT论文用的一模一样的预训练源数据从哪找吗

2021-03-23

CTR模型的交互类的特征是怎么做的和存储的?

2021-03-19

解决 Spark OOM 有哪些基本思路?

2021-03-19

多GPU数据并行训练的加速原理到底是什么?

2021-02-18

2021年了,有哪些稳压bert和roberta的预训练模型?

2021-01-20

现在机器学习的库都是Python的,而服务器貌似是Java性能最好,怎么处理这个问题?

2016-11-22

gdb都能调试什么类型的文件?

2016-10-17

Spark里一行scala代码看不懂?

2016-02-29

spark example 有个地方看不懂

2016-02-01

maven,自己的 程序包不存在?

2015-12-03

如何寻找一个java文件的所有import的java,把这些所有java都打到一个jar包,自动化?

2015-12-03

Eclipse有办法打Jar包时自动解决(自身项目内的)依赖问题吗?

2015-12-03

google的protobuf比这样java原生的方式更有效率吗?

2015-11-19

.h文件里定义了一个类,怎么链接到so文件里?

2015-09-09

cocos2d-x lua怎么滤色?

2015-09-02

看jvm某个类的成员变量的值

2015-08-28

JAVA怎么从特定【行】开始读字串?

2015-08-24

一小段scala代码看不懂?

2015-08-21

scala如何初始化一个Tuple3数组?

2015-08-18

用jstack看到的WAITING和BLOCK的区别的是什么

2015-08-18

linux搭建spark源码环境,执行build/sdt gen-idea要twitter东西?

2015-08-14

Spark里的DAG是怎么回事?

2015-08-12

invoke方法如何加-Xmx2000M之类的VM参数

2015-08-03

spark1.2里的一小段scala代码看不懂

2015-03-03

为什么数据库要插入数据后再建B-Tree等结构的索引,而不是边插边建?

2015-03-24

Spark哪些分布式计算可以脱离HDFS跑?

2015-07-03

akka 简单例子总是 not delivered和dead letters encountered

2015-07-09

Eclipse里如何debug跟踪MapReduce程序到hadoop源码里?

2015-07-31

有没有自动生成复杂sql的软件?

2015-07-14

java swing awt, 如何实现一个按钮按下之后刷新界面

2015-07-03

java正则表达式,怎么写一个match包含空格的pattern?

2015-06-04

java正则表达式,如何表示一个非某个字符的匹配

2015-06-04

为什么hdfs不支持随机写?

2015-03-11

java项目里什么情况下用PL/SQL?

2015-03-12

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除