2018年08月_happyprince

12月 11月 09月 08月 07月 06月 03月 02月 01月

转载基于典型相关分析的词向量

转自：https://blog.csdn.net/wangyangzhizhou/article/details/79009096

2018-08-15 15:37:29 378

转载 Learning to Rank 简介

转自：Kemaswill http://www.cnblogs.com/kemaswill/archive/2013/06/01/3109497.htmlLearning to Rank 简介  去年实习时，因为项目需要，接触了一下Learning to Rank(以下简称L2R)，感觉很有意思，也有很大的应用价值。L2R将机器学习的技术很好的应用到了排序中，并提出了一些新的理论...

2018-08-12 19:57:44 2360

原创 PGM---pgmpy学习

官网http://pgmpy.org/githubhttps://github.com/pgmpy/pgmpy#installation三种方法安装Using conda:$ conda install -c ankurankan pgmpyUsing pip:$ pip install -r requirements.txt # or requirements-de...

2018-08-07 14:06:54 11099 13

原创专家系统--pyKE小例01

事实库[family.kfb]son_of(david, bruce)son_of(bruce, thomas)son_of(thomas, frederik)son_of(frederik, hiram)规则库[fc_familykrb]direct_father_son foreach family.son_of($son, $father)...

2018-08-04 13:12:57 1760

原创 pyKE专家系统

官网：http://pyke.sourceforge.net/about_pyke/index.html下载：《Python Knowledge Engine (PyKE)》 https://sourceforge.net/projects/pyke/files/安装： #python setup.py build# python setup.py instal...

2018-08-03 17:38:41 4501

原创 jupyter安装测试

官网：http://jupyter.org/ 安装： python -m pip install –upgrade pip python -m pip install jupyter 配置：生成配置文件：jupyter notebook –generate-config 设置密码：jupyter notebook password 找到.jupyter文件夹，发现文件jupyter...

2018-08-03 12:33:17 703 1

原创 DL----karas可视化工具

Keras Visualization Toolkit with 3D gradCAMgithubhttps://github.com/kitamura-felipe/keras-vis

2018-08-02 18:08:49 402

原创 NLP----Baidu-中文词法分析（LAC）

简介 LAC是一个联合的词法分析模型，整体性地完成中文分词、词性标注、专名识别任务。LAC既可以认为是Lexical Analysis of Chinese的首字母缩写，也可以认为是LAC Analyzes Chinese的递归缩写。 LAC基于一个堆叠的双向GRU结构，在长文本上准确复刻了百度AI开放平台上的词法分析算法。效果方面，分词、词性、专名识别的整体准确率95.5...

2018-08-02 17:29:23 6010

原创 NLP---LTP(哈工大社会计算与信息检索研究中心)

介绍语言技术平台（Language Technology Platform，LTP）是哈工大社会计算与信息检索研究中心历时十年开发的一整套中文语言处理系统。LTP制定了基于XML的语言处理结果表示，并在此基础上提供了一整套自底向上的丰富而且高效的中文语言处理模块（包括词法、句法、语义等6项中文处理核心技术），以及基于动态链接库（Dynamic Link Library, DLL）的应用程序接口...

2018-08-01 13:56:07 1138

原创 NLP---THULAC：一个高效的中文词法分析工具包

软件简介 THULAC（THU Lexical Analyzer for Chinese）由清华大学自然语言处理与社会人文计算实验室研制推出的一套中文词法分析工具包，具有中文分词和词性标注功能。THULAC具有如下几个特点：能力强。利用我们集成的目前世界上规模最大的人工分词和词性标注中文语料库（约含5800万字）训练而成，模型标注能力强大。准确率高。该工具包在...

2018-08-01 11:50:01 1577 2

原创 NLP--THUCTC: 一个高效的中文文本分类工具包

项目介绍 THUCTC(THU Chinese Text Classification)是由清华大学自然语言处理实验室推出的中文文本分类工具包，能够自动高效地实现用户自定义的文本分类语料的训练、评测、分类功能。文本分类通常包括特征选取、特征降维、分类模型学习三个步骤。如何选取合适的文本特征并进行降维，是中文文本分类的挑战性问题。我组根据多年在中文文本分类的研究经验，在THUCTC中选...

2018-08-01 11:42:34 1413

twisted例子

这个代码例子要结合之前上传的《Twisted系列教程等》这个一起看。

2017-12-05

思维导向图软件

mindmaster可以用来画思维导向图，感觉比较好用，分析时可以用。

2017-12-01

fasttext.zip[windows]

fasttext,基于windows的工具，可以用作文本分类，文本表达。FastText for Windows (2017-05-15)

2017-11-19

stopwords.txt

对于NLP中，需要要一些停用字典来对一些没有用的词删除，这里列了一些停用词。

2017-11-10

FINDING STRUCTURE WITH RANDOMNESS.pdf

FINDING STRUCTURE WITH RANDOMNESS.pdf描述了一系列的矩阵的方法。

2017-11-04

LDA数学八卦.pdf

LDA数学八卦，描述了LDA的数学，通俗易懂，是一个难得的学习材料。

2017-11-04

SogouC.mini.20061102.rar

SogouC.mini.20061102.rar是一个简单的数据集，用来测试NLP算法的，为了大家的方便，故上传于此。

2017-10-25

presto-cli-0.184-executable.jar

presto-cli是presto的客户端工具，可用用这个工具来连接presto服务器的。可以实现交互式查询。 ./presto.jar --server 主机IP:主机port

2017-09-24

apache-flume-1.7.0-bin.tar.gz

Flume是Cloudera提供的一个高可用的，高可靠的，分布式的海量日志采集、聚合和传输的系统，Flume支持在日志系统中定制各类数据发送方，用于收集数据；同时，Flume提供对数据进行简单处理，并写到各种数据接受方（可定制）的能力。

2017-09-23

apache-maven-3.3.9-bin.tar.gz

hadoop,habase等大数据包的编译工具Maven. Maven项目对象模型(POM)，可以通过一小段描述信息来管理项目的构建，报告和文档的软件项目管理工具。

2017-09-16

hbase-1.3.1-src.tar.gz

HBase是一个分布式的、面向列的开源数据库，该技术来源于 Fay Chang 所撰写的Google论文“Bigtable：一个结构化数据的分布式存储系统”。是大数据的重要组成部分。

2017-09-16

zookeeper-3.4.9.tar.gz

zookeeper安装包。ZooKeeper是一个分布式的，开放源码的分布式应用程序协调服务，是Google的Chubby一个开源的实现，是Hadoop和Hbase的重要组件。

2017-09-15

SQuirrel SQL

SQuirrel SQL是一个数据工具，可以连接多个数据，同时他可以连接presto数据库。从某个方面来说，是一个比较好的数据库客户端工具。

2017-09-15

PANDAS文档

数据的dataframe处理库。

2017-05-15

numpy文件档

numpy文件，是机器学习的有用包numpy的API文档，是数据挖掘与机器学习的必备品。基于矩阵的操作包。

2017-05-15

scikit-learn-docs.pdf

scikit-learn文件，是机器学习的有用包sklearn的API文档，是数据挖掘与机器学习的必备品。

2017-05-15

python-3.5.2-amd64

python-3.5.2-amd64支持Tensorflow win7 64bit的python版本。

2017-02-22

tensorflow-0.12.1-cp35-cp35m-win_amd64

tensorflow-0.12.1-cp35-cp35m-win_amd64.whl 为win7【64bit】+python3.5.2[64bit]环境下可用的深度学习包，已经测试了。

2017-02-22

EasyBCD 中文

EasyBCD 中文 rar可以设置引导两个系统

2015-05-02

Spy4Win查看窗口

Spy4Win Spy 窗口信息打开程序后,把这个图标拖动到相应的窗口上即可读取信息。

2015-04-30

Spy++查看窗口进程

Spy++ Lite是一款强有力的编程辅助工具，对分析窗体结构有独到之处。

2015-04-30

ProceXP监控进程

ProceXP监控进程可以用来反病毒

2015-04-30

PE Explorer查看PE

PE Explorer.rar可以查看PE的数据结构。

2015-04-30

StudPE查看PE

StudPE.rar可以查看PE，查看EXE是否合法。

2015-04-30

nyt数据集-公开数据集

nyt数据集，是一个公开数据集，可以用来进行关系抽取。

2021-05-10

MSRA（NER）.zip

MSRA.zip表示用来训练与测试NER任务的原数据。

2021-03-02

zh_msra_onto4_mrc4ner.zip

论文A Unified MRC Framework for Named Entity Recognition的预处理构建的中文的两个数据集数据。

2021-03-02

unlv_uw3.zip

表格标数据集unlv与uw3.

2020-12-24

SemEval2010_task8_all_data

论文《Classifying Relations by Ranking with Convolutional Neural Networks》中的数据集--SemEval2010_task8_all_data.

2020-05-25

en_core_web_sm

en_core_web_sm为spacy的数据模型，里面有两个版本，可以选择合适的版本。要不会出错，raise source.error('bad escape %s' % escape, len(escape))；sre_constants.error: bad escape \p at position 257

2020-05-25

SQLiteExpertPro_64.rar

SQLiteExpertPro主要是用来查看sqlite数据的工具。

2020-05-20

spouse_data.zip

spouse_data为snorkel的入门例子数据集。

2020-05-19

labelimg标记工具

labelImg用来标记图片数据。标记完数据之后用来训练。

2019-03-04

sighan-bakeoff

著名的Sighan Bakeoff语料。包含了训练集、测试集及测试集的（黄金）标准切分，同时也包括了一个用于评分的脚本和一个可以作为基线测试的简单中文分词器。

2018-08-16

pyke专家系统

pyke包了python2与python3的源码。这个是专家系统的一个包。

2018-08-03

rasa_core-master

rasa_core是开源的对话系统框架。通过这个框架可以快速搭建对话框架。

2018-07-06

x-pack-5.6.1_修改

x-pack-5.6.1.jar包，是对认证文件重新编译的，为学习ES提供一个好的学习环境，x-pack不会过期。

2018-02-22

luyten-0.5.0

luyten-0.5.0,是一个java反编译工具，可以把class文件反编译成java代码。

2018-02-22

crf++_0.58[linux and win]

CRF++ is a simple, customizable, and open source implementation of Conditional Random Fields (CRFs) for segmenting/labeling sequential data. CRF++ is designed for generic purpose and will be applied to a variety of NLP tasks, such as Named Entity Recognition, Information Extraction and Text Chunking.

2018-01-14

Twisted系列教程等

python网络框架twisted教程，事件驱动编程是一个编程范式，这个程序是由外部事件来决定。通过事件循环及当事件发生时触发回调事件的使用是它的特点。另外两种常见的编程范式是（单线程）同步与多线程编程。

2017-12-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人