机器学习
文章平均质量分 90
ML、AutoML、TimeSeries
小数志
欢迎关注个人公众号:小数志
展开
-
Pytorch学习系列教程:入门简介
导读新的一年还是要肝起来啊,这个公众号节前节后沉寂了快两个月了,许久没更新原创推文,自己感觉不能再这样堕落下去了。所以最近一直在思考写些什么推文:既要符合当下工作所需,倒逼成长;也要于广大...原创 2022-02-14 12:00:00 · 1104 阅读 · 0 评论 -
一名数据分析师到算法工程师的转岗经历
导读了解小编的读者应该知道,我在从事了一段数据分析师的工作之后,目前岗位的title已经换成了算法工程师。虽然两个岗位存在很大交集和共通之处,但无论是工作思维还是所需技术栈方面,也都存在很...原创 2022-03-21 12:00:00 · 5283 阅读 · 0 评论 -
PyTorch学习系列教程:何为Tensor?
导读本文继续PyTorch学习系列教程,来介绍在深度学习中最为基础也最为关键的数据结构——Tensor。一方面,Tensor之于PyTorch就好比是array之于Numpy或者DataF...原创 2022-02-28 12:00:00 · 8616 阅读 · 0 评论 -
PyTorch学习系列教程:Tensor如何实现自动求导
。导读今天本文继续PyTorch学习系列。虽然前几篇推文阅读效果不是很好(大体可能与本系列推文是新开的一个方向有关),但自己选择的路也要坚持走下去啊!前篇推文介绍了搭建一个深度学习模型的基...原创 2022-03-14 12:00:00 · 2338 阅读 · 0 评论 -
PyTorch学习系列教程:构建一个深度学习模型需要哪几步?
导读继续PyTorch学习系列。前篇介绍了PyTorch中最为基础也最为核心的数据结构——Tensor,有了这些基本概念即可开始深度学习实践了。本篇围绕这一话题,本着提纲挈领删繁就简的原则...原创 2022-03-07 12:00:00 · 5496 阅读 · 0 评论 -
从0开始实现一个Adaboost分类器(完整代码)
导读日前,通俗易懂的推导了三种集成学习的原理及主要公式,今天本文基于Python从0开始手动实现一个Adaboost分类器,文中提供完整代码。01 Adaboost基本原理回顾Adabo...原创 2020-11-12 21:55:12 · 253 阅读 · 0 评论 -
Naive Bayes——Naive在哪?
导读经典机器学习算法中,Naive Bayes可占一席之地,也是唯一一个纯粹的概率分类算法模型。考虑其原理简单却不失强悍性能,Naive Bayes是个人最喜爱的算法之一——当然,另一个...原创 2020-11-25 23:14:47 · 280 阅读 · 0 评论 -
三种集成学习算法原理及核心公式推导
导读本文主要介绍3种集成学习算法的原理及重要公式推导部分,包括随机森林(Random Forest)、自适应提升(AdaBoost)、梯度提升(Gradient Boosting)。仅对...原创 2020-11-08 20:00:00 · 1404 阅读 · 0 评论 -
深入理解逻辑回归及公式推导
导读逻辑回归是一种线性模型,更确切的说是嵌套了一层sigmoid函数的线性模型。写在滕王阁下的一篇文章01 为什么叫逻辑回归分类和回归是机器学习中两类经典的问题,而逻辑回归虽然叫回归,却...原创 2020-11-11 08:20:00 · 333 阅读 · 0 评论 -
畅快-5000字通俗讲透决策树基本原理
导读在当今这个人工智能时代,似乎人人都或多或少听过机器学习算法;而在众多机器学习算法中,决策树则无疑是最重要的经典算法之一。这里,称其最重要的经典算法是因为以此为基础,诞生了一大批集成算法...原创 2021-03-27 19:15:00 · 228 阅读 · 0 评论 -
还在当调参侠?推荐这三个超参优化库【含示例代码】
导读在传统的算法建模过程中,影响算法性能的一个重要环节、也可能是最为耗时和无趣的一项工作就是算法的调参,即超参数优化(Hyper-parameter Optimization,HPO),因...原创 2021-08-01 15:47:08 · 831 阅读 · 0 评论 -
【综述】机器学习中的12类算法
导读最近在研究一些机器学习方面的论文,翻到了一篇较早的机器学习综述(2017年),虽然不是最新的研究现状,但考虑到经典机器学习算法其实发展并不像深度学习那么迅猛,所以其论述还是很有参考性。...原创 2021-07-11 12:00:00 · 237 阅读 · 0 评论 -
一张图介绍机器学习中的集成学习算法
导读机器学习在当下早已成为一项热门的技术,在众多机器学习算法中,除去深度学习和强化学习等最新发展方向,若是谈及经典机器学习算法,那么集成学习算法无论是在效果上还是热度上都是当之无愧的焦点。...原创 2021-08-30 12:00:00 · 277 阅读 · 0 评论 -
自动化机器学习(AutoML)入门简介
导读近期在学习研究一些关于自动化机器学习方面的论文,本文作为该系列的第一篇文章,就AutoML的一些基本概念和现状进行简单分享,权当抱砖引玉。图片源自《Taking Human out o...原创 2021-07-13 12:00:00 · 2912 阅读 · 0 评论 -
还在苦恼特征工程?不妨试试这个库
导读从事机器学习相关岗位的同学都知道这样一句话:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限。在数据确定的情况下,那么特征工程就成了唯一可供发挥的关键步骤。广义来讲,特征工...原创 2021-08-08 12:00:00 · 155 阅读 · 0 评论 -
数据科学:Sklearn中的决策树,底层是如何设计和存储的?
导读前期在做一些机器学习的预研工作,对一篇迁移随机森林的论文进行了算法复现,其中需要对sklearn中的决策树进行继承和扩展API,这就要求理解决策树的底层是如何设计和实现的。本文围绕这一...原创 2021-11-30 12:00:00 · 339 阅读 · 0 评论 -
时序预测的三种方式:统计学模型、机器学习、循环神经网络
导读时序预测是一类经典的问题,在学术界和工业界都有着广泛的研究和应用。甚至说,世间万物加上时间维度后都可抽象为时间序列问题,例如股票价格、天气变化等等。关于时序预测问题的相关理论也极为广泛...原创 2021-12-20 12:00:00 · 2642 阅读 · 1 评论 -
数据科学系列:plotly可视化入门介绍
导读在入道数据岗位之初,曾系列写过多个数据科学工具包的入门教程,包括Numpy、Pandas、Matplotlib、Seaborn、Sklearn等,这些也构成了自己当初的核心工具栈。在这...原创 2021-11-22 12:00:00 · 5810 阅读 · 0 评论 -
一名数据分析师的机器学习历程
导读笔者的上一个角色是一名数据分析师,期间重点把数据分析岗必备的技能都刷了一遍,包括ESP基础套餐(Excel + SQL + Python)、Python数分三剑客(Numpy + Pa...原创 2021-08-29 12:00:00 · 292 阅读 · 0 评论 -
一文介绍机器学习中的三种特征选择方法
导读机器学习中的一个经典理论是:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限。也正因如此,特征工程在机器学习流程中占有着重要地位。广义的特征工程一般可分为三个环节:特征提取...原创 2021-09-04 12:00:00 · 830 阅读 · 0 评论 -
最近,深入研究了一下数据挖掘竞赛神器——XGBoost的算法原理和模型数据结构...
导读从事数据挖掘相关工作的人肯定都知道XGBoost算法,这个曾经闪耀于数据挖掘竞赛的一代神器,是2016年由陈天齐大神所提出来的经典算法。本质上来讲,XGBoost算作是对GBDT算法的...原创 2021-12-06 12:00:00 · 1252 阅读 · 0 评论 -
Python中的时序分析工具包推荐(1)
导读时间序列分析是一类经典问题,常见的场景需求包括时序预测、时序分裂、时序聚类、异常检测等。作为一名算法工程师,当调包遇上时间序列,有哪些好用的工具包呢?本篇首先介绍3个:tsfresh、...原创 2021-12-27 11:45:00 · 1732 阅读 · 0 评论 -
Python中的时序分析工具包推荐(2)
导读在前期推文Python中的时序分析工具包推荐(1)中介绍了时序分析的三个工具包,分别侧重于时序特征工程、基于sklearn的时序建模和更为高级的时序建模工具。今天,本篇再来介绍4个时序...原创 2022-01-03 18:24:05 · 1491 阅读 · 0 评论 -
临行在即,分享一个自己写的sklearn源码库
导读考虑接下来一段时间会出差在外,现将自己近1个月来学习ML算法的一点成果做以分享,相关源码纯干货版本已上传至GitHub,有需要者可通过"阅读原文"连接自行clone。...原创 2020-05-07 23:02:15 · 194 阅读 · 1 评论