AI小白入门
微信公众号:StudyForAI(AI小白人工)
机器学习、深度学习、自然语言处理学习与研究笔记~~
更多文章更方便的阅读学习,请关注:
知乎专栏:https://zhuanlan.zhihu.com/c_1046337776244539392
AI小白入门
公众号:StudyForAI
知乎:https://www.zhihu.com/people/yuquanle/columns
展开
-
【机器学习】三层神经网络
来源 | AI小白入门作者 | 文杰编辑 | yuquanle原文链接三层神经网络1. 神经单元 深度学习的发展一般分为三个阶段,感知机–>三层神经网络–>深度学习(表示学习)。早先的感知机由于采用线性模型,无法解决异或问题,表示能力受到限制。为此三层神经网络放弃了感知机良好的解释性,而引入非线性激活函数来增加模型的表示能力。三层神经网络与感知机的两点不同1)非...原创 2020-04-03 16:29:33 · 1343 阅读 · 0 评论 -
【机器学习】Fisher线性判别与线性感知机
来源 | AI小白入门作者 | 文杰编辑 | yuquanle原文链接Fisher线性判别与线性感知机 Fisher线性判别和线性感知机都是针对分类任务,尤其是二分类,二者的共同之处在于都是线性分类器,不同之处在于构建分类器的思想,但是二者有异曲同工之妙。同时二者又可以与logistic回归进行对比,当然logistic回归的理论基础是概率。1. Fisher线性判别 Fi...原创 2020-04-03 16:21:38 · 1100 阅读 · 0 评论 -
【机器学习】知否?知否?广义线性模型
来源 | AI小白入门作者 | 文杰编辑 | yuquanle原文链接广义线性模型 从线性回归,logistic回归,softmax回归,最大熵的概率解释来看,我们会发现线性回归是基于高斯分布+最大似然估计的结果,logistic回归是伯努利分布+对数最大似然估计的结果,softmax回归是多项分布+对数最大似然估计的结果,最大熵是基于期望+对数似然估计的结果。前三者可以从广义线...原创 2020-04-03 16:03:08 · 318 阅读 · 0 评论 -
【机器学习】对数线性模型之Logistic回归、SoftMax回归和最大熵模型
来源 | AI小白入门作者 | 文杰编辑 | yuquanle完整代码见:原文链接1. Logistic回归 分类问题可以看作是在回归函数上的一个分类。一般情况下定义二值函数,然而二值函数构成的损失函数非凸,一般采用sigmoid函数平滑拟合(当然也可以看作是一种软划分,概率划分):从函数图像我们能看出,该函数有很好的特性,适合二分类问题。至于为何选择Sigmoid函数,后面可...原创 2020-04-03 15:50:45 · 512 阅读 · 0 评论 -
【机器学习】一文读懂线性回归、岭回归和Lasso回归
来源 | AI小白入门作者 | 文杰编辑 | yuquanle完整代码见:原文链接1. 线性回归1.1 线性回归 假设有数据有T={(x(1),y(1)),...,(x(i),y(i)),...,(x(m),y(m))}T=\left \{ \left ( x^{(1)},y^{(1)} \right ) ,...,\left ( x^{(i)},y^{(i)} \right...原创 2020-04-03 15:03:14 · 875 阅读 · 0 评论 -
自然语言处理中注意力机制综述
目录写在前面Seq2Seq 模型NLP中Attention mechanism的起源NLP中的注意力机制4.1 Hierarchical Attention4.2 Self-Attention4.3 Memory-based Attention4.4 Soft/Hard Attention4.5 Global/Local Attention评价指标写在后面参考文献近些年来...原创 2019-01-19 15:04:22 · 5236 阅读 · 1 评论 -
新网银行杯数据科学竞赛复赛第八名总结
更多实时更新的个人学习笔记分享,请关注:知乎:https://www.zhihu.com/people/yuquanle/columns微信订阅号:AI小白入门ID: StudyForAI竞赛背景四川新网银行属于全国首批将机器学习技术应用到实际零售信贷业务中的银行。目前,四川新网银行已经开发出了国内第一款全在线办理的银行大额云授信产品——“好人贷”。在”好人贷“的量化风控实践中...原创 2019-01-10 16:10:49 · 1661 阅读 · 1 评论 -
2018年"达观杯"文本智能处理挑战赛-长文本分类-rank4解决方案
声明:转载请注明出处,谢谢:https://blog.csdn.net/m0_37306360/article/details/84871836另外,更多实时更新的个人学习笔记分享,请关注:知乎:https://www.zhihu.com/people/yuquanle/columns公众号:StudyForAI今年暑假和朋友(https://www.zhihu.com/people/h...原创 2018-12-16 11:51:52 · 3901 阅读 · 0 评论 -
【智能司法】可解释的Rationale增强罪名预测系统
来源 | AI小白入门原文链接论文标题:Interpretable Rationale Augmented Charge Prediction System 论文来源:COLING 2018 论文链接:https://www.aclweb.org/anthology/C18-2032/引言任务定义罪名预测(Charge prediction)是智能司法领域最热门的任务之一...原创 2020-04-02 17:32:22 · 947 阅读 · 0 评论 -
【机器学习】GBDT
提升树提升树GBDT同样基于最小化第mmm个学习器和前m−1m-1m−1个学习器累加起来损失函数最小,提升树采用残差的思想来最小化损失函数,将投票权重放到学习器上,使得基学习器的权重都为1。GBDT将损失用一阶多项式拟合,基学习器拟合梯度,学习器的权重为一阶多项式的系数。在前面的Adaboost中,我们需要学习MMM个基学习器,赋予不同的权重组合得到最后的强学习器。它是基于MMM个基学习器组...原创 2020-04-02 17:05:52 · 385 阅读 · 0 评论 -
【机器学习】Adaboost
AdaboostAdaboost的Boosting理解Adaboost是集成学习中Boosting方式的代表。多个基学习器其串行执行,下一个学习器基于上一个学习器的经验,通过调整样本的权重,使得上一个错分的样本在下一个分类器更受重视而达到不断提升的效果。Adaboost集成多个学习器的关键在两点:设置基学习器的权重:am=12log1−emema_{m}=\frac{1}{2}log...原创 2020-04-02 17:01:53 · 490 阅读 · 0 评论 -
【机器学习】随机森林
集成学习集成学习通过构建多个学习器采用加权的方式来完成学习任务,类似于”三个臭皮匠顶个诸葛亮”的思想。当然多个学习器之间需要满足一定的条件,一般来讲,多个学习器同属于一种模型,比如决策树,线性模型,而不会交叉用多种模型。为了保证集成学习的有效性,多个弱分类器之间应该满足两个条件:准确性:个体学习器要有一定的准确性,这样才能有好的效果。多样性:学习器之间要有一些差异,因为完全相同的几...原创 2020-04-02 16:54:18 · 807 阅读 · 0 评论 -
【机器学习】决策树
来源 | AI小白入门作者 | 文杰编辑 | yuquanle原文链接决策树简介决策树是一种基本的分类和回归方法,用于分类主要是借助每一个叶子节点对应一种属性判定,通过不断的判定导出最终的决策;用于回归则是用均值函数进行多次二分,用子树中数据的均值进行回归。决策树算法中,主要的步骤有:特征选择,建树,剪枝。接下来将介绍三种典型的决策树算法:ID3,C4.5,CART。优点:...原创 2020-04-02 16:42:07 · 674 阅读 · 0 评论 -
Macheine Learning Yearning学习笔记(六)
Chapter 33~Chapter 35详细讨论了与人类水平表现的比较Chapter 33、Why we compare to human-level performance(为什么我们要比较人类水平的表现)很多机器学习系统旨在帮助人类做事情。例如图像识别,语音识别,以及垃圾邮件分类。学习算法也提高了很多,我们现在能够在越来越多的任务中超越人类的表现。此外,如果你正在试图做一项人类可...原创 2018-06-07 00:27:13 · 1580 阅读 · 0 评论 -
Macheine Learning Yearning学习笔记(五)
Chapter 28~Chapter 32详细讨论了学习曲线(Learning curves)Chapter 28、Diagnosing bias and variance: Learning curves(诊断偏差和方差:学习曲线)我们已经学习了一些方法去估计有多少错误可归因于可避免的偏差和方差。我们通过估计最优错误率,并计算算法的训练集和开发集误差来进行估计的。下面讨论一个更具体的方法...原创 2018-06-07 00:08:47 · 1589 阅读 · 0 评论 -
Macheine Learning Yearning学习笔记(四)
Chapter 20~Chapter 27详细讨论了Bias 和VarianceChapter 20、Bias and Variance: The two big sources of error(偏差和方差是误差的两大来源)假设你的训练集、开发集和测试集都来自相同的分布。那么你应该总是试图去获取更多的训练数据,因为这样能只提高性能,对吗?机器学习中有两个主要误差来源:偏差和方差。理解...原创 2018-06-06 23:08:59 · 1578 阅读 · 0 评论 -
Macheine Learning Yearning学习笔记(三)
Chapter 13~Chapter18 详细讨论了常见的基本的误差分析Chapter 13、Build your first system quickly, then iterate(快速构建第一个系统,然后再一步步迭代)在做工程项目时,不要试图一开始就设计完美的系统。相反,应该快速构建和训练出第一版基本系统(也许在短短的几天内)。即使基本系统与您能构建的“最佳”系统相差甚远,研究基本系...原创 2018-06-06 23:03:17 · 1536 阅读 · 0 评论 -
Macheine Learning Yearning学习笔记(二)
Chapter 5~Chapter 12 详细讨论了设置开发集(development sets)和测试集(test sets)Chapter 5、Your development and test sets (您的开发和测试集)让我们回到前面的例子:猫的图片问题,其实可以看成一个二分类的问题,当图片是猫时,这是正样本(positive examples),当图片不是猫时,这些样本是负样本...原创 2018-06-03 23:17:02 · 1642 阅读 · 0 评论 -
Macheine Learning Yearning学习笔记(一)
前面Chapter1~Chapter 4谈了一些基本概念Chapter 1、Why Machine Learning Strategy (为什么要学习机器学习策略) 这一章告诉我们机器学习策略的重要性,以一个实际的机器学习项目切入: 猫检测算法,这是一个经典的计算机视觉领域的问题,判断给定一张图片是否是猫。当我们提出的算法准确性还不够好的时候,我们应该怎么做?这个时候我们可能会面临很多...原创 2018-06-03 23:08:15 · 1730 阅读 · 0 评论 -
Machine Learning Yearning介绍
Machine Learning Yearning是NG的新书,不过这本书的重点不在于教授ML算法,而在于教你如何使ML算法发挥作用。 很多AI课程会给教你制造一个锤子; 这本书教你如何使用锤子。 如果你渴望成为AI的技术领导者并想学习如何为你的团队设定方向,这本书将会有所帮助。官网地址:http://www.mlyearning.org/ github上现在可以看到:https://git...原创 2018-06-01 16:12:38 · 5228 阅读 · 0 评论 -
工具篇Flair之训练自己的Flair Embeddings
更多实时更新的个人学习笔记分享,请关注:知乎:https://www.zhihu.com/people/yuquanle/columns微信订阅号:AI小白入门ID: StudyForAIFlair工具使用教程之如何训练自己的Flair Embeddings教程地址:https://github.com/zalandoresearch/flair/blob/master/res...原创 2019-01-17 17:11:21 · 1406 阅读 · 0 评论 -
工具篇Flair之优化模型教程
更多实时更新的个人学习笔记分享,请关注:知乎:https://www.zhihu.com/people/yuquanle/columns微信订阅号:AI小白入门ID: StudyForAIFlair工具使用教程之如何优化自己的模型教程地址:https://github.com/zalandoresearch/flair/blob/master/resources/docs/T...原创 2019-01-17 17:08:39 · 2811 阅读 · 9 评论 -
工具篇Flair之训练模型教程
更多实时更新的个人学习笔记分享,请关注:知乎:https://www.zhihu.com/people/yuquanle/columns微信订阅号:AI小白入门ID: StudyForAIFlair工具使用教程之如何训练自己的模型教程地址:https://github.com/zalandoresearch/flair/blob/master/resources/docs/TU...原创 2019-01-17 17:03:35 · 3813 阅读 · 9 评论 -
工具篇Flair之使用加载语料库教程
更多实时更新的个人学习笔记分享,请关注:知乎:https://www.zhihu.com/people/yuquanle/columns微信订阅号:AI小白入门ID: StudyForAIFlair工具使用教程之如何加载自己的语料库本教程的展示了如何加载自己的语料库,以便训练自己的模型。教程地址:https://github.com/zalandoresearch/flair...原创 2019-01-17 16:54:44 · 3223 阅读 · 2 评论 -
工具篇Flair之文档嵌入教程
更多实时更新的个人学习笔记分享,请关注:知乎:https://www.zhihu.com/people/yuquanle/columns微信订阅号:AI小白入门ID: StudyForAIFlair文档嵌入教程文档嵌入与单词嵌入不同之处在于它们为您提供了一个嵌入整个文本的内容,而文字嵌入则为您提供了嵌入单个单词的内容。所有文档嵌入类都继承自DocumentEmbeddi...原创 2019-01-17 15:57:34 · 776 阅读 · 2 评论 -
工具篇Flair之使用词向量教程
更多实时更新的个人学习笔记分享,请关注:知乎:https://www.zhihu.com/people/yuquanle/columns微信订阅号:AI小白入门ID: StudyForAIFlair工具使用教程教程三: 如何使用词向量教程地址:https://github.com/zalandoresearch/flair/blob/master/resources/d...原创 2019-01-17 15:50:48 · 1643 阅读 · 2 评论 -
工具篇Flair之使用预训练模型教程
更多实时更新的个人学习笔记分享,请关注:知乎:https://www.zhihu.com/people/yuquanle/columns微信订阅号:AI小白入门ID: StudyForAIFlair工具使用教程教程二: 如何使用预先训练的模型标记您的文本。使用预训练模型进行标记让我们使用预先训练的模型进行命名实体识别(NER)。 该模型通过英语CoNLL-03任务进行...原创 2019-01-17 15:36:35 · 1244 阅读 · 0 评论 -
自然语言处理基础技术工具篇之PKUSeg
更多实时更新的个人学习笔记分享,请关注:知乎:https://www.zhihu.com/people/yuquanle/columns微信订阅号:AI小白入门ID: StudyForAIPKUseg简介简单易用,支持细分领域分词,有效提升了分词准确度,支持用户自训练模型。支持用户使用全新的标注数据进行训练。多领域分词。不同于以往的通用中文分词工具,此工具包同时致力于为...原创 2019-01-12 13:16:13 · 2555 阅读 · 0 评论 -
自然语言处理基础技术工具篇之Flair
更多实时更新的个人学习笔记分享,请关注:知乎:https://www.zhihu.com/people/yuquanle/columns微信订阅号:AI小白入门ID: StudyForAIFlair简介Flair是最近开源的一个基于Pytorch的NLP框架,据官方github介绍,它具有以下特点:一个功能强大的NLP库。 Flair允许您将最先进的自然语言处理(NLP...原创 2019-01-07 10:43:54 · 2027 阅读 · 2 评论 -
TextBlob实战之朴素贝叶斯文本分类
更多实时更新的个人学习笔记分享,请关注:知乎:https://www.zhihu.com/people/yuquanle/columns微信订阅号:AI小白入门ID: StudyForAITextBlob实现文本分类一个使用TextBlob进行Naive Bayes classifier参考:https://textblob.readthedocs.io/en/dev/cla...原创 2019-01-05 21:12:27 · 1421 阅读 · 7 评论 -
自然语言处理基础技术工具篇之TextBlob
更多实时更新的个人学习笔记分享,请关注:知乎:https://www.zhihu.com/people/yuquanle/columns微信订阅号:AI小白入门ID: StudyForAITextBlob简介TextBlob是一个用Python编写的开源的文本处理库。它可以用来执行很多自然语言处理的任务,比如,词性标注,名词性成分提取,情感分析,文本翻译,等等。Github地...原创 2019-01-05 21:07:10 · 1874 阅读 · 0 评论 -
自然语言处理基础技术工具篇之NLTK
更多实时更新的个人学习笔记分享,请关注:知乎:https://www.zhihu.com/people/yuquanle/columns微信订阅号:AI小白入门ID: StudyForAINLTK简介NLTK被称为“使用Python进行计算语言学教学和工作的绝佳工具”。 它为50多种语料库和词汇资源(如WordNet)提供了易于使用的界面,还提供了一套用于分类,标记化,词干化,...原创 2019-01-05 21:03:12 · 2254 阅读 · 0 评论 -
自然语言处理基础技术工具篇之Pyltp
更多实时更新的个人学习笔记分享,请关注:知乎:https://www.zhihu.com/people/yuquanle/columns微信订阅号:AI小白入门ID: StudyForAIpyltp简介LTP提供了一系列中文自然语言处理工具,用户可以使用这些工具对于中文文本进行分词、词性标注、句法分析等等工作。Pyltp是其的python接口。官网地址:https://www...原创 2019-01-05 20:52:48 · 1091 阅读 · 0 评论 -
自然语言处理基础技术工具篇之spaCy
更多实时更新的个人学习笔记分享,请关注:知乎:https://www.zhihu.com/people/yuquanle/columns微信订阅号:AI小白入门ID: StudyForAIspaCy简介spaCy是世界上最快的工业级自然语言处理工具。 支持多种自然语言处理基本功能。官网地址:https://spacy.io/spaCy主要功能包括分词、词性标注、词干化、命名...原创 2019-01-05 20:50:37 · 2095 阅读 · 0 评论 -
自然语言处理基础技术工具篇之Stanfordcorenlp
更多实时更新的个人学习笔记分享,请关注:知乎:https://www.zhihu.com/people/yuquanle/columns微信订阅号:人工智能小白入门学习ID: StudyForAIStanfordcorenlp简介Stanford CoreNLP提供了一套人类语言技术工具。 支持多种自然语言处理基本功能,Stanfordcorenlp是它的一个python接口。...原创 2019-01-05 20:46:11 · 3642 阅读 · 2 评论 -
自然语言处理基础技术工具篇之SnowNLP
SnowNLP简介SnowNLP是一个可以方便的处理中文文本内容的python类库,是受到了TextBlob的启发而写的,和TextBlob不同的是,这里没有用NLTK,所有的算法都是自己实现的,并且自带了一些训练好的字典。Github地址:isnowfy/snownlpSnowNLP主要功能包括分词、词性标注、情感分析、汉字转拼音、繁体转简体、关键词提取以及文本摘要等等。安装:pip i...原创 2019-01-05 20:22:38 · 2280 阅读 · 0 评论 -
自然语言处理基础技术工具篇之HanLP
声明:转载请注明出处,谢谢:https://blog.csdn.net/m0_37306360/article/details/84849419另外,更多实时更新的个人学习笔记分享,请关注:知乎:https://www.zhihu.com/people/yuquanle/columns公众号:StudyForAIHanlp简介HanLP是一系列模型与算法组成的NLP工具包,由大快搜索主...原创 2018-12-07 11:24:24 · 1717 阅读 · 1 评论 -
自然语言处理基础技术工具篇之Jieba
声明:转载请注明出处,谢谢:https://blog.csdn.net/m0_37306360/article/details/84831982另外,更多实时更新的个人学习笔记分享,请关注:知乎:https://www.zhihu.com/people/yuquanle/columns公众号:StudyForAI没想到坚持学习以及写作总结已经超过半个月了,谢谢大家的关注、点赞、收藏~~...原创 2018-12-06 11:15:22 · 1430 阅读 · 0 评论 -
自然语言处理基础技术之语义角色标注实战
声明:转载请注明出处,谢谢:https://blog.csdn.net/m0_37306360/article/details/84721576另外,更多实时更新的个人学习笔记分享,请关注:知乎:https://www.zhihu.com/people/yuquanle/columns公众号:StudyForAInlpnet语义角色标注安装:pip install nlpnet国内源...原创 2018-12-05 13:31:42 · 2447 阅读 · 2 评论 -
自然语言处理基础技术之语义角色标注
声明:转载请注明出处,谢谢:https://blog.csdn.net/m0_37306360/article/details/84712213另外,更多实时更新的个人学习笔记分享,请关注:知乎:https://www.zhihu.com/people/yuquanle/columns公众号:StudyForAI今天是总结nlp基础技术的最后一篇,后面开始工具实战篇,我觉得实践对新手小白...原创 2018-12-04 15:04:40 · 2829 阅读 · 0 评论