![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
zdcs
这个作者很懒,什么都没留下…
展开
-
在 '凯盛专家app ' 上作得演讲 -- 人工智能在P2P金融反欺诈应用
PPT下载http://download.csdn.net/detail/zdcs/9701251网络演讲录音(约一小时)可用手机下载 凯盛专家app https://www.capvision.com/home/experts_app收听原创 2016-12-04 11:46:52 · 1754 阅读 · 0 评论 -
Stanford Natural Language Inference (SNLI)和Multi-Genre NLI Corpus(MultiNLI) 数据集
Stanford Natural Language Inference (SNLI)和Multi-Genre NLI Corpus(MultiNLI) 数据集https://nlp.stanford.edu/projects/snli/https://www.nyu.edu/projects/bowman/multinli/MultiNLI是SNLI的升级版,格式一样,规模相当,但是前者变化更...原创 2018-02-19 10:45:01 · 8038 阅读 · 0 评论 -
SST数据集
参考:http://blog.csdn.net/ltochange/article/details/61194650http://blog.csdn.net/yeyang911/article/details/54378716转载 2018-02-19 00:29:24 · 11994 阅读 · 1 评论 -
微软的MSR paraphrase数据集
5800对句子,人工标注关于语料的来源和标注方式参考readme样本如下, 非常简单明了:下载地址:https://www.microsoft.com/en-us/download/details.aspx?id=52398Quality #1 ID #2 ID #1 String #2 String1 702876 702977 Amrozi accused his brother, whom ...原创 2018-02-19 00:25:59 · 4074 阅读 · 0 评论 -
微软WikiQA corpus 简介
太简单了,没什么好翻译的The WikiQA corpus is a new publicly available set of question and sentence pairs, collected and annotated for research on open-domain question answering. Last published: August 28, 2015....转载 2018-02-18 23:06:21 · 3956 阅读 · 0 评论 -
MSLR数据集简介
微软发布的两个规模较大的learning to rank数据集MSLR-WEB30k 30,000个查询query从其中随机采样10,000个形成mslr-web10k 描述:queries 和 urls 由ID来表示. 数据集包含了从q-u对中抽取的特征向量以及相关性评价标签(1) 相关性评价来自于 Microsoft Bing,5分制, 从0 (不相关) 到 4 (最相关).(2) 特征由...原创 2018-02-18 22:41:25 · 2516 阅读 · 1 评论 -
关于保险的问答数据集
地址:https://github.com/shuzi/insuranceQA仅用于研究目的使用请引用一下论文: Applying Deep Learning to Answer Selection: A Study and An Open Task Minwei Feng, Bing Xiang, Michael R. Glass, Lidan Wang, Bowen Zhou ASRU 2...原创 2018-02-27 14:32:00 · 1544 阅读 · 1 评论 -
TrecQA 数据集简介
TrecQA------ TrecQA 数据集一般用来评估QA的答案选择 它由一下论文发表和组织:+ Wang et al. [What is the Jeopardy Model? A Quasi-Synchronous Grammar for QA.](http://www.aclweb.org/anthology/D07-1003) *EMNLP-CoNLL 2007*.+ He...原创 2018-02-27 14:12:24 · 5999 阅读 · 0 评论 -
AG及新闻主题分类数据集
AG是由ComeToMyHead超过一年的努力,从2000多不同的新闻来源搜集的超过1百万的新闻文章ComeToMyHead是一个学术新闻搜索引擎,开始于2004年7月 http://www.di.unipi.it/~gulli/AG_corpus_of_news_articles.html该数据集由学术社区提供,用于研究分类,聚类,信息获取(rank,搜索)...等非商业活动两个格式版...原创 2018-02-27 10:18:38 · 8811 阅读 · 2 评论 -
libffm with ftrl updater
这个东西之前就听说过,在某些特定场景效果很好,看到一个开源项目,所以把要点翻译了一些,同时实践了一下;大部分内容与libffm相同开源项目: https://github.com/CNevd/libffm-ftrl全名Factorization Machines with Follow-The-Regularized-Leader 论文Fac原创 2017-01-26 16:40:32 · 2969 阅读 · 1 评论 -
kaggle 各种评价指标之二 :Error Metrics for Classification Problems 分类问题错误度量
基本上必须看一遍,顺便简单翻译一下:(暂时留着,持续更新ing)Error Metrics for Classification Problems 分类问题错误度量 Logarithmic Loss对数损失The logarithm of the likelihood function for a Bernoulli random dist原创 2017-01-10 14:49:51 · 3514 阅读 · 0 评论 -
kaggle 各种评价指标之一 :Error Metrics for Regression Problems 回归问题错误度量
基本上必须看一遍,顺便简单翻译一下:1 MAE统计上,MAE是一个用来衡量预测和最终结果之间的接近程度的数量In statistics, the mean absolute error (MAE) is a quantity used to measure how close forecasts or predictions are to the eventua原创 2017-01-10 14:17:55 · 4787 阅读 · 1 评论 -
lightGBM笔记(持续更新)
这个东西被视为比xgboost更好的GBDT原创 2017-01-14 10:39:43 · 17361 阅读 · 2 评论 -
关于安装xgboost和lightGBM的python3封装的问题" Error: setup script specifies an absolute path"及其解决办法
无论是xgboost还是lightGBM,在python3的安装市,都会遇到一下类似问题installing library code to build/bdist.linux-x86_64/eggrunning install_librunning build_pyerror: Error: setup script specifies an absolute pat原创 2016-12-30 14:57:29 · 3508 阅读 · 1 评论 -
在 '凯盛咨询' 上作得演讲 -- Fintech系列之一:人工智能在金融投资中应用概述
2016/12/28 晚上9点开始网络演讲录音(约一小时)可用手机下载 凯盛app https://www.capvision.com/home/experts_app收听稍后发出slides原创 2016-12-28 10:29:52 · 882 阅读 · 0 评论 -
First Quora Dataset Release: Question Pairs
我就喜欢这种格式简单明了的数据集:id qid1 qid2 question1 question2 is_duplicate0 1 2 What is the step by step guide to invest in share market in india? What is the step by step guide to invest in share market? 01 3 4 ...原创 2018-02-22 00:51:06 · 1339 阅读 · 0 评论