机器学习
LeYOUNGER
UESTC CS PhD Candidate
展开
-
[医学图像处理] 使用pyvips对WSI svs文件进行读取并自定义patch输出大小
摘要最近需要对WSI图像进行处理,以前没弄过,所以整理下方法。环境:Ubuntu 18.04 LTS, Python 3.7, pyvips数据: [TCGA-GBM (Survival Prediction)]本文主要参考以下两个博客:https://blog.csdn.net/weixin_41594007/article/details/81810231https://blog.csdn.net/songyu0120/article/details/85087529安装pyvip原创 2021-02-09 20:55:33 · 3182 阅读 · 1 评论 -
[生成对抗网络] 论文研读-SeqGAN: Sequence Generative Adversarial Nets with Policy Gradient
GAN作为生成器已经在图像方面大放异彩,然而在NLP方面的应用还不多,原因一部分在于GAN是为连续空间设计的,而NLP是离散的,因此需要一点小小的trick才可以work原创 2017-12-04 19:28:53 · 2195 阅读 · 0 评论 -
[比赛分享] 2017 JD京东 比赛代码开源分享
AI法官队友弃赛,吾心甚痛,欲置ML与身外,奈何毕业将至,身无长物,故,重新振作看论文,打比赛。。。原创 2017-12-05 11:17:13 · 3009 阅读 · 8 评论 -
[比赛交流] JDD
https://github.com/yaoleiliu/2017-JDD-Global-Data-Explorer-Competition转载 2017-12-21 16:36:39 · 752 阅读 · 0 评论 -
[面试笔记] 决策树、随机森林、GBDT、XGBoost
本文主要分享了 决策树、随机森林、GBDT、XGBoost 四种模型的原理决策树转载 2017-12-11 15:19:03 · 6397 阅读 · 1 评论 -
[比赛分享] Kaggle-Toxic Comment [Keras多二分类,优质Comment语料, Pre-trained词向量的使用]
最近在看一个Kaggle的比赛【Toxic Comment】,本博客主要分享学习到的新姿势原创 2018-01-02 10:42:47 · 4920 阅读 · 7 评论 -
[自然语言处理] 在NLP的路上越走越远(自然语言处理各类资源wiki)
ACL文章链接 http://www.aclweb.org/anthology/ 2016年ACL-WMT机器翻译数据集PaperWeekly http://rsarxiv.github.io/中国NLP联盟(墙裂推荐) https://github.com/NLPchina中文NLP工具大全 https://github.com/N原创 2017-06-28 22:14:52 · 1143 阅读 · 0 评论 -
[知识图谱] Neo4J实战骚操作--用图数据库找到自己的远房亲戚 [手动捂脸]
摘要NLP应用中一个很重要的内容是知识图谱,而图数据库是构建知识图谱的很好选择,所以,耍起基本语句Step 1 :创建实体(1) CREATE (:Person {name:'TangBrother1', gender:'Male'}) Step 2 : 查询实体(2) MATCH (p:Person) RETURN p 然后可以看到原创 2018-01-25 16:24:44 · 3018 阅读 · 0 评论 -
[比赛交流] AI法官
分享一个解决方案https://github.com/ShawnyXiao/BDCI2017-AIJudge第四名: http://www.cnblogs.com/llhthinker/p/8127788.html转载 2017-12-20 10:28:08 · 1753 阅读 · 1 评论 -
如何构造GBDT组合特征
使用GBDT进行特征抽象,可以说是非常的有用了~我是萌萌哒的传送门: http://blog.csdn.net/zhangf666/article/details/70183788转载 2018-02-26 16:11:24 · 2929 阅读 · 0 评论 -
滑窗法-时序结构化数据比赛利器
【链接】数据挖掘比赛之“滑窗法” http://blog.csdn.net/oXiaoBuDianEr123/article/details/79309022转载 2018-02-13 13:25:46 · 3589 阅读 · 0 评论 -
[自然语言处理] 预训练词向量百度云下载 [Word2Vec, Glove, FastText]
English Pre-trained word embeddingsGoogle’s word2vec embedding: 外网地址: [Word2Vec] [DownloadLink]300维英语词向量:[百度云]Glove word vectors: 外网地址: [Glove]国内地址:[百度云]Facebook’s fastText embeddings: 外网地址...原创 2018-02-21 17:11:34 · 22684 阅读 · 11 评论 -
[环境配置] Ubuntu 16.04.3 + 1080Ti 环境下配置Tensorflow-GPU
摘要本文是经过多次失败的尝试后所得到的经验积累,作为分享参考文章: http://blog.csdn.net/zhaoyu106/article/details/52793183安装Ubuntu 16.04.3准备工作使用iso镜像以及UltraISO在Windows下制作U盘启动盘 [相关教程]在BIOS中选择U盘启动 [注意:BIOS中会有两个选项:UEFI...原创 2018-03-01 14:51:43 · 474 阅读 · 0 评论 -
[比赛分享] 分享一个Kaggle 上的 Stacking方法 [1]
摘要Stacking方法是模型融合的一个方法,当然流派很多,我知道的有: (然而我分不清Blend和Stack的区别, 手动滑稽)使用有放回无重复的取样,训练多个子模型,通过子模型生成新的训练集和测试集,再进行下一波训练使用多个弱模型的输出作为下一层模型的输入Kaggle中的这个方法Kaggle原文链接 https://www.kaggle.com/dongxu027...转载 2018-03-21 10:14:34 · 1676 阅读 · 0 评论 -
[比赛分享] Kaggle-Toxic Comment 中使用的各种深度学习模型, 处理方法和套路
摘要最近在做一个Kaggle比赛, 于此分享一下所使用的DL模型(经过简化),希望能对初学者有所帮助。 (最后结果,公榜23/4512,私榜87/4512,过拟合了啊啊啊啊T.T)比赛地址: https://www.kaggle.com/c/jigsaw-toxic-comment-classification-challenge模型中所使用的词嵌入请参看如下博客: ...原创 2018-03-21 10:16:51 · 3911 阅读 · 4 评论 -
[Keras] Keras使用中遇到的一些坑~
主要内容如题,遇到的时候会黑人问号脸的Keras Issues1. Class Weights问题问题描述:Keras在多分类或多二分类时使用Class Weights时会报错,提示class not exists,这是一个已知的Keras Bug,有一个work around的方法是,在label vector前面加两个位置,分别赋值0和1,举个例子:# Origin...原创 2018-06-09 11:16:07 · 778 阅读 · 1 评论 -
[深度学习] (1): 实现一个简单的XOR
摘要开始学习DL,各种代价函数,各种分布,这里分享一个用NN实现XOR的例子转载 2017-09-21 17:03:25 · 5881 阅读 · 0 评论 -
[自然语言处理] 分享一个工业级NLP工具-SpaCy
分享一个工业级NLP工具-SpaCy转载 2017-12-04 17:06:15 · 1011 阅读 · 0 评论 -
[自然语言处理] (6) 主题提取 + 文本实体标注
NER原创 2017-12-12 16:25:14 · 6913 阅读 · 0 评论 -
Windows Anaconda Tensorflow 安装
Windows Anaconda Tensorflow 安装原创 2017-06-06 00:18:03 · 550 阅读 · 0 评论 -
Tensorflow 学习笔记
研二可能搞大数据,Spark和数据挖掘、机器学习什么的可能都要用到,做个笔记,顺带分享原创 2017-06-08 21:32:29 · 682 阅读 · 0 评论 -
[读书笔记] 《Python 机器学习》
摘要机器学习 NLP 两手都要抓,两手都要硬原创 2017-07-14 18:00:04 · 545 阅读 · 0 评论 -
[读书笔记] 《Python 机器学习》- 过拟合的几种解决方法
机器学习时,经常会出现过拟合的问题,本文介绍了几种解决方法原创 2017-07-19 15:15:45 · 5934 阅读 · 2 评论 -
[读书笔记] 《Python 机器学习》 - 使用RandomParameterOpt与GridSearch进行超参调整
对于模型超参的调整,为了加快搜索速度,我们可以借助GridSearch来穷举找到一个最优值,也可以使用RandomOptimization在更大的搜索域进行随机搜索来找到一个最优值,这里我根据demo分别用两种搜索方法,结合SVM和RandomForest进行简单的超参搜索.原创 2017-07-26 19:56:12 · 2526 阅读 · 0 评论 -
[读书笔记] 《Python 机器学习》- 使用嵌套交叉验证进行模型选择
通过嵌套交叉验证选择算法对特定数据集进行模型选择原创 2017-07-26 20:14:19 · 2221 阅读 · 0 评论 -
[读书笔记] 《Python 机器学习》- 各种模型选择方法的封装
在分类问题中,模型的选择方式和评判标准多种多样,为了方便以后使用,在粗浅的知识储备下,我用sklearn封装了一下各种选择器和一部分评分方法,提供了单一分类器,网格搜索和随机搜索三种方式,使用的时候可以根据需求自由定制参数,添加需要用到的分类器原创 2017-07-27 21:15:22 · 2465 阅读 · 0 评论 -
[转载] XGBOOST中值得学习的调参方法
Xgboost转载 2017-08-07 23:36:18 · 741 阅读 · 1 评论 -
[读书笔记] 《中文自然语言处理》
摘要学习中文NLP,记录学习历程,顺便弄个WIKI 。持续更新中。。。。原创 2017-08-08 15:45:36 · 971 阅读 · 0 评论 -
[自然语言处理] NLP优秀论文+博客WIKI
看论文,学姿势 233333持续更新中。。。原创 2017-09-25 15:42:32 · 3586 阅读 · 0 评论 -
[深度学习] (2):实现简单的线性回归(使用TensorFlow优化)
在学习使用TensorFlow, 动手写了LR的一般实现和TF实现,用的都是GD优化,但是TF明显快啊原创 2017-09-23 16:48:17 · 658 阅读 · 0 评论 -
[读书笔记] 《机器学习-实用案例解析》 Wiki
机器学习-实用案例解析Wiki原创 2017-08-17 17:06:37 · 624 阅读 · 0 评论 -
[生成对抗网络] GAN
GAN原创 2017-11-08 12:26:23 · 456 阅读 · 0 评论 -
[深度学习] (3)- Keras实现一个简单的翻译器( 从数字到对应的英文 )
摘要来搞NMT啊哈哈哈哈原创 2017-09-28 17:41:20 · 2932 阅读 · 0 评论 -
[比赛记录] 主流机器学习模型模板代码+经验分享[xgb, lgb, Keras, LR]
最近打各种比赛,在这里分享一些GeneralModel,稍微改改就能用的原创 2017-11-30 14:00:00 · 6885 阅读 · 2 评论 -
[面试笔记] 面试知识点准备-机器学习基础
摘要要找工作啦,心累,持续更新中。。。原创 2017-11-21 11:45:19 · 680 阅读 · 0 评论