twisted例子
这个代码例子要结合之前上传的《Twisted系列教程等》这个一起看。
思维导向图软件
mindmaster可以用来画思维导向图,感觉比较好用,分析时可以用。
fasttext.zip[windows]
fasttext,基于windows的工具,可以用作文本分类,文本表达。FastText for Windows (2017-05-15)
stopwords.txt
对于NLP中,需要要一些停用字典来对一些没有用的词删除,这里列了一些停用词。
FINDING STRUCTURE WITH RANDOMNESS.pdf
FINDING STRUCTURE WITH RANDOMNESS.pdf描述了一系列的矩阵的方法。
LDA数学八卦.pdf
LDA数学八卦,描述了LDA的数学,通俗易懂,是一个难得的学习材料 。
SogouC.mini.20061102.rar
SogouC.mini.20061102.rar是一个简单的数据集,用来测试NLP算法的,为了大家的方便,故上传于此。
presto-cli-0.184-executable.jar
presto-cli是presto的客户端工具,可用用这个工具来连接presto服务器的。可以实现交互式查询。 ./presto.jar --server 主机IP:主机port
apache-flume-1.7.0-bin.tar.gz
Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。
apache-maven-3.3.9-bin.tar.gz
hadoop,habase等大数据包的编译工具Maven. Maven项目对象模型(POM),可以通过一小段描述信息来管理项目的构建,报告和文档的软件项目管理工具。
hbase-1.3.1-src.tar.gz
HBase是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。是大数据的重要组成部分。
zookeeper-3.4.9.tar.gz
zookeeper安装包。ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是Hadoop和Hbase的重要组件。
SQuirrel SQL
SQuirrel SQL是一个数据工具,可以连接多个数据,同时他可以连接presto数据库。
从某个方面来说,是一个比较好的数据库客户端工具。
PANDAS文档
数据的dataframe处理库。
numpy文件档
numpy文件,是机器学习的有用包numpy的API文档,是数据挖掘与机器学习的必备品。基于矩阵的操作包。
scikit-learn-docs.pdf
scikit-learn文件,是机器学习的有用包sklearn的API文档,是数据挖掘与机器学习的必备品。
python-3.5.2-amd64
python-3.5.2-amd64支持Tensorflow win7 64bit的python版本。
tensorflow-0.12.1-cp35-cp35m-win_amd64
tensorflow-0.12.1-cp35-cp35m-win_amd64.whl 为win7【64bit】+python3.5.2[64bit]环境下可用的深度学习包,已经测试了。
EasyBCD 中文
EasyBCD 中文 rar可以设置引导两个系统
Spy4Win查看窗口
Spy4Win Spy 窗口信息 打开程序后,把这个图标拖动到相应的窗口上即可读取信息。
Spy++查看窗口进程
Spy++ Lite是一款强有力的编程辅助工具,对分析窗体结构有独到之处。
ProceXP监控进程
ProceXP监控进程可以用来反病毒
PE Explorer查看PE
PE Explorer.rar可以查看PE的数据结构。
StudPE查看PE
StudPE.rar可以查看PE,查看EXE是否合法。
nyt数据集-公开数据集
nyt数据集,是一个公开数据集,可以用来进行关系抽取。
MSRA(NER).zip
MSRA.zip表示用来训练与测试NER任务的原数据。
zh_msra_onto4_mrc4ner.zip
论文A Unified MRC Framework for Named Entity Recognition的预处理构建的中文的两个数据集数据。
unlv_uw3.zip
表格标数据集unlv与uw3.
SemEval2010_task8_all_data
论文《Classifying Relations by Ranking with Convolutional Neural Networks》中的数据集--SemEval2010_task8_all_data.
en_core_web_sm
en_core_web_sm为spacy的数据模型,里面有两个版本,可以选择合适的版本。要不会出错,raise source.error('bad escape %s' % escape, len(escape));sre_constants.error: bad escape \p at position 257
SQLiteExpertPro_64.rar
SQLiteExpertPro主要是用来查看sqlite数据的工具。
spouse_data.zip
spouse_data为snorkel的入门例子数据集。
labelimg标记工具
labelImg用来标记图片数据。 标记完数据之后用来训练。
sighan-bakeoff
著名的Sighan Bakeoff语料。包含了训练集、测试集及测试集的(黄金)标准切分,同时也包括了一个用于评分的脚本和一个可以作为基线测试的简单中文分词器。
pyke专家系统
pyke包了python2与python3的源码。这个是专家系统的一个包。
rasa_core-master
rasa_core是开源的对话系统框架。通过这个框架可以快速搭建对话框架。
x-pack-5.6.1_修改
x-pack-5.6.1.jar包,是对认证文件重新编译的,为学习ES提供一个好的学习环境,x-pack不会过期。
luyten-0.5.0
luyten-0.5.0,是一个java反编译工具,可以把class文件反编译成java代码。
crf++_0.58[linux and win]
CRF++ is a simple, customizable, and open source implementation of Conditional Random Fields (CRFs) for segmenting/labeling sequential data. CRF++ is designed for generic purpose and will be applied to a variety of NLP tasks, such as Named Entity Recognition, Information Extraction and Text Chunking.
Twisted系列教程等
python网络框架twisted教程,事件驱动编程是一个编程范式, 这个程序是由外部事件来决定。通过事件循环及当事件发生时触发回调事件的使用是它的特点。另外两种常见的编程范式是(单线程)同步与多线程编程。