Master Learning
文章平均质量分 84
gcaxuxi
这个作者很懒,什么都没留下…
展开
-
Machine Learning
ml系列概述 本系列文章主要针对个人在现阶段的学习情况,因为目前研究生学习的是机器学习。最近在searching又翻阅了不少知名博主的博文,深受启发,尤其是wepon大神,博主是北大的,顺便参观了他(她)的其他主页,都很优秀。希望未来的日子能像w神一样,能够在互联网中拥有自己的知识库,点滴聚与江河,我将在本系列中把machine learning部分进行个人的知识曲线整理,这样不仅可以自我督促也原创 2017-02-18 21:17:04 · 6285 阅读 · 0 评论 -
机器学习数学基础
本章转自Mxnet文档,是当下机器学习必备的数学基础,可以供大家平时学习查阅。数学基础本节总结了本书中涉及到的有关线性代数、微分和概率的基础知识。为避免赘述本书未涉及的数学背景知识,本节中的少数定义稍有简化。线性代数以下分别概括了向量、矩阵、运算、范数、特征向量和特征值的概念。向量本书中的向量指的是列向量。一个nnn维向量xx\boldsymbol{x}的表...转载 2018-07-16 15:36:04 · 683 阅读 · 0 评论 -
关于表格型数据的数据挖掘(总)
从本篇开始,我将会开启个人在实习阶段所做的项目经验。以此做好个人笔记,作为以后知识点的汇总,也希望能给各位做个大致的数据挖掘的思路。文章系列分为4篇:数据的获得及处理、频繁项集、聚类和关联规则。顺序是按照项目逻辑进行排序的,本篇我们将对整体的思路进行个说明。目录数据的获得及处理频繁项集聚类关联规则1. 数据的获得及处理实践过程中,如何获得项目中所需的数...原创 2018-06-05 14:45:32 · 1846 阅读 · 0 评论 -
数值计算和SVM讲解(下)
2.2.1 Original SVM 终于把所有的铺垫介绍完毕,本节开始我们正式进入SVM。 首先我们简单介绍一下朴素SVM,这个“朴素”一词是本人自己加上的。其意旨脱去加上核函数和SMO算法等等其他知识,展现最为“原始”的SVM思想。根据2.1.2一节,我们知道SVM的基本架构(代价函数等等)与logistic回归统一,区别在于它的焦点在于支持向量这些点上。那么直观而言,我们希望最优超原创 2017-09-01 19:09:59 · 7026 阅读 · 0 评论 -
数值分析和SVM讲解(上)
今天我们聊聊数值计算(优化)和SVM,首先本篇的数值计算我觉着更适合用“优化”来代替,因为我们将会以优化问题作为本篇数学部分主要的介绍内容,或者不够严谨的说法是,你也可以理解为对高数知识的巩固(比较前面的线性代数和概率论)。后半部分我们会将知识代入SVM中去进行介绍,需要说明的是,我们的介绍是提纲挈领式的,因为SVM足够成熟,并且细致下去,很多人已经做出了很多了解释,比我粗鄙的语言要丰富得多。对于全原创 2017-11-07 17:14:23 · 728 阅读 · 0 评论 -
利用微信监管MXNet训练
最近一直在跟沐神学习MXNet轮子。论坛的小伙伴很不错,gluon的特效也很简单实用(听说效率和显存的利用率都比其他的要高)。无聊在知乎看到有人用用微信可以监管TF的训练结果——利用微信监管你的TF训练。国庆既然没得地方玩,就试着仿照作者做了个MXNet的微信监管。功能主要有:设置参数,主要有learning_rate、training_iters、batch_size开始停止程序,反馈结果原创 2017-10-03 10:36:29 · 8609 阅读 · 0 评论 -
数值计算和SVM讲解(中)
2.1 SVM预备 这一部分紧接上一篇《数值计算和SVM讲解(上)》。 之前一直考虑如何写这部分,如果按部就班地和前面一样,很多大神其实很早就已经写出了关于SVM的优质详解blog。而且,本篇开头我的预想是想借由SVM和各位读者分享一下机器学习的思路,所以第二部分我们首先介绍几部分与SVM相关的预备知识,把学习的思路捋一捋。2.1.1 关于数据维度在《线代和PCA详解》一文中,我们介绍了降维的原创 2017-09-01 19:04:35 · 12138 阅读 · 0 评论 -
概率论及logistic回归讲解
概率论及logistic回归详解 上一篇我们介绍了线性代数的基本知识,并以PCA作为案例进行了讲解。在本篇中,我们依然按照相同的思路进行开展:首先复习一下概率的相关知识,最后以对率回归(对数几率回归)为案例进行讲解。1. 概率论AI圣经《deep learning》一书把线性代数、概率与信息论和数值计算三部分作为机器学习中基础的数学知识进行单独设置章节来讲解,可见这几部分对机器学习乃至深度学习原创 2017-08-17 16:29:30 · 27575 阅读 · 3 评论 -
PCA线性代数讲解
线性代数及PCA详解 本章对最近学习的线性代数知识进行总结,最后以PCA为例运用线代中的相关知识讨论其中的原理。才疏学浅,各位有什么意见可以讨论,一起查缺补漏。1. 线代基础对于深度学习,它需要一定的数学和机器学习基础,特别的,线性代数、概率与信息论和数值计算尤为重要(参见《deep learning》一书)所以我们本章主要对线代进行讨论,当然主要是为了针对PCA包含的知识点。如果有同学希望可原创 2017-08-07 10:33:11 · 26977 阅读 · 3 评论 -
统计语言模型
好久没有写文章了,主要在忙老板关于电网方面的专利,侧重于数学建模。还是很头疼的。今天主要是《数学之美》系列中的第三章关于NLP的内容。主要侧重于对古德-图灵模型的讲解,主要网上的讲解实在不全,几波看下来,基本都是同一人文章的转载,这里我详细介绍下。肯定有不足,欢迎大家给出意见。如需转载,请标明转载出处北工大xuxi原创 2017-05-06 20:55:49 · 451 阅读 · 0 评论 -
3.文献检索
信息检索 是一名研究生必备的技能.本篇将在几款软件的基础之上介绍如何信息检索大学期间毕设随便查查,并没有对此下过苦功夫的我终于还是要还回时间和精力去深入学习了。导师的要求一般是查阅SCI,IEEE等大量具有“含金量”的外文文献。一方面,这考察每个人的英语阅读水平;另一方面,如何精准查找目标文献(核心文献,大牛文献?)因为个人可能还会继续深造,所以提早养好文献检索和管理的习惯,对后期的帮助原创 2017-02-23 22:01:01 · 6544 阅读 · 1 评论 -
2.ml learing routine
机器学习之路 上篇我叙述了自己的近期的学习历程,主要从时间顺序总结了一些随手获取的知识。 但是较为零散,今天主要把这些化整为零,总结一篇routine或者说plan,来给自己接下来做好铺垫。宏观上来说:首先ng的机器学习基础知识体还是需要重固和完善,配合zhang的笔记 —>接着攻克深度学习,配以神经网络在线书—>最后进行实践,按照wepon神的案例进行实践。本月目标:原创 2017-02-19 10:21:56 · 301 阅读 · 0 评论 -
关于表格型数据的数据挖掘(一)——爬虫
本篇主要承接上篇文章,介绍我们如何获取项目中的所需的数据。获取的方式很多,特别的,我们本次使用爬虫来尽可能方便地爬取我们的目标数据。文章末尾,我们将给出python代码供大家参考。目录需求分析技术路线具体实现1. 需求分析软件工程专业提到最多的就是“需求分析”,本次我们的项目主要针对中医妇科疾病,其目的在于分析出针对某些药方数据分布(例如某本药方古籍或者中医药方数据...原创 2018-07-04 21:50:05 · 1177 阅读 · 0 评论