自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 资源 (115)
  • 收藏
  • 关注

原创 [论文阅读笔记42]BioSyn

题目Biomedical Entity Representations with Synonym Marginalization具有同义词边缘化的生物医学实体表示Korea University (韩国)高丽大学代码:https://github.com/dmis-lab/BioSynSung M , Jeon H , Lee J , et al. Biomedical Entity Representations with Synonym Marginalization[J]. Proc

2021-06-20 13:53:21 1051

原创 [论文阅读笔记41]关于医学的bert专题

论文1:BioBert论文题目:BioBERT: a pre-trained biomedical language representation model for biomedical text mining论文地址:https://arxiv.org/abs/1901.08746项目地址:https://github.com/naver/biobert-pretrained论文概要:Korea University, 以通用领域预训练bert为初始权重,基于Pubmed上大量医疗领域英文..

2021-06-20 13:41:47 2666

原创 [论文阅读笔记40]recall与rank相结合的多视角中文过程术语标准化

题目2021 - A multi-perspective combined recall and rank framework for Chinese procedure terminology normalization解决中文术语标准化; 华东理工大学https://github.com/sxthunder/CMTNhttps://arxiv.org/pdf/2101.09101.pdf摘要提出一个关于召回和排名的组合框架.由多任务候选生成器(MTCG),关键字关注力排名器(KAR),融

2021-06-08 22:41:55 556

原创 [论文阅读笔记39]中文医学概念标准化(共病网络)

一,题目Chinese Medical Concept Normalization by Using Text and Comorbidity Network EmbeddingY. Zhang, X. Ma and G. Song, “Chinese Medical Concept Normalization by Using Text and Comorbidity Network Embedding,” 2018 IEEE International Conference on Data Mini

2021-06-08 22:38:10 635 2

twisted例子

这个代码例子要结合之前上传的《Twisted系列教程等》这个一起看。

2017-12-05

思维导向图软件

mindmaster可以用来画思维导向图,感觉比较好用,分析时可以用。

2017-12-01

fasttext.zip[windows]

fasttext,基于windows的工具,可以用作文本分类,文本表达。FastText for Windows (2017-05-15)

2017-11-19

stopwords.txt

对于NLP中,需要要一些停用字典来对一些没有用的词删除,这里列了一些停用词。

2017-11-10

FINDING STRUCTURE WITH RANDOMNESS.pdf

FINDING STRUCTURE WITH RANDOMNESS.pdf描述了一系列的矩阵的方法。

2017-11-04

LDA数学八卦.pdf

LDA数学八卦,描述了LDA的数学,通俗易懂,是一个难得的学习材料 。

2017-11-04

SogouC.mini.20061102.rar

SogouC.mini.20061102.rar是一个简单的数据集,用来测试NLP算法的,为了大家的方便,故上传于此。

2017-10-25

presto-cli-0.184-executable.jar

presto-cli是presto的客户端工具,可用用这个工具来连接presto服务器的。可以实现交互式查询。 ./presto.jar --server 主机IP:主机port

2017-09-24

apache-flume-1.7.0-bin.tar.gz

Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。

2017-09-23

apache-maven-3.3.9-bin.tar.gz

hadoop,habase等大数据包的编译工具Maven. Maven项目对象模型(POM),可以通过一小段描述信息来管理项目的构建,报告和文档的软件项目管理工具。

2017-09-16

hbase-1.3.1-src.tar.gz

HBase是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。是大数据的重要组成部分。

2017-09-16

zookeeper-3.4.9.tar.gz

zookeeper安装包。ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是Hadoop和Hbase的重要组件。

2017-09-15

SQuirrel SQL

SQuirrel SQL是一个数据工具,可以连接多个数据,同时他可以连接presto数据库。 从某个方面来说,是一个比较好的数据库客户端工具。

2017-09-15

PANDAS文档

数据的dataframe处理库。

2017-05-15

numpy文件档

numpy文件,是机器学习的有用包numpy的API文档,是数据挖掘与机器学习的必备品。基于矩阵的操作包。

2017-05-15

scikit-learn-docs.pdf

scikit-learn文件,是机器学习的有用包sklearn的API文档,是数据挖掘与机器学习的必备品。

2017-05-15

python-3.5.2-amd64

python-3.5.2-amd64支持Tensorflow win7 64bit的python版本。

2017-02-22

tensorflow-0.12.1-cp35-cp35m-win_amd64

tensorflow-0.12.1-cp35-cp35m-win_amd64.whl 为win7【64bit】+python3.5.2[64bit]环境下可用的深度学习包,已经测试了。

2017-02-22

EasyBCD 中文

EasyBCD 中文 rar可以设置引导两个系统

2015-05-02

Spy4Win查看窗口

Spy4Win Spy 窗口信息 打开程序后,把这个图标拖动到相应的窗口上即可读取信息。

2015-04-30

Spy++查看窗口进程

Spy++ Lite是一款强有力的编程辅助工具,对分析窗体结构有独到之处。

2015-04-30

ProceXP监控进程

ProceXP监控进程可以用来反病毒

2015-04-30

PE Explorer查看PE

PE Explorer.rar可以查看PE的数据结构。

2015-04-30

StudPE查看PE

StudPE.rar可以查看PE,查看EXE是否合法。

2015-04-30

nyt数据集-公开数据集

nyt数据集,是一个公开数据集,可以用来进行关系抽取。

2021-05-10

MSRA(NER).zip

MSRA.zip表示用来训练与测试NER任务的原数据。

2021-03-02

zh_msra_onto4_mrc4ner.zip

论文A Unified MRC Framework for Named Entity Recognition的预处理构建的中文的两个数据集数据。

2021-03-02

unlv_uw3.zip

表格标数据集unlv与uw3.

2020-12-24

SemEval2010_task8_all_data

论文《Classifying Relations by Ranking with Convolutional Neural Networks》中的数据集--SemEval2010_task8_all_data.

2020-05-25

en_core_web_sm

en_core_web_sm为spacy的数据模型,里面有两个版本,可以选择合适的版本。要不会出错,raise source.error('bad escape %s' % escape, len(escape));sre_constants.error: bad escape \p at position 257

2020-05-25

SQLiteExpertPro_64.rar

SQLiteExpertPro主要是用来查看sqlite数据的工具。

2020-05-20

spouse_data.zip

spouse_data为snorkel的入门例子数据集。

2020-05-19

labelimg标记工具

labelImg用来标记图片数据。 标记完数据之后用来训练。

2019-03-04

sighan-bakeoff

著名的Sighan Bakeoff语料。包含了训练集、测试集及测试集的(黄金)标准切分,同时也包括了一个用于评分的脚本和一个可以作为基线测试的简单中文分词器。

2018-08-16

pyke专家系统

pyke包了python2与python3的源码。这个是专家系统的一个包。

2018-08-03

rasa_core-master

rasa_core是开源的对话系统框架。通过这个框架可以快速搭建对话框架。

2018-07-06

x-pack-5.6.1_修改

x-pack-5.6.1.jar包,是对认证文件重新编译的,为学习ES提供一个好的学习环境,x-pack不会过期。

2018-02-22

luyten-0.5.0

luyten-0.5.0,是一个java反编译工具,可以把class文件反编译成java代码。

2018-02-22

crf++_0.58[linux and win]

CRF++ is a simple, customizable, and open source implementation of Conditional Random Fields (CRFs) for segmenting/labeling sequential data. CRF++ is designed for generic purpose and will be applied to a variety of NLP tasks, such as Named Entity Recognition, Information Extraction and Text Chunking.

2018-01-14

Twisted系列教程等

python网络框架twisted教程,事件驱动编程是一个编程范式, 这个程序是由外部事件来决定。通过事件循环及当事件发生时触发回调事件的使用是它的特点。另外两种常见的编程范式是(单线程)同步与多线程编程。

2017-12-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除