机器学习
文章平均质量分 60
Microstrong0305
菜鸟程序猿
展开
-
深入理解CatBoost
我的个人微信公众号: Microstrong微信公众号ID: MicrostrongAI微信公众号介绍: Microstrong(小强)同学主要研究机器学习、深度学习、计算机视觉、智能对话系统相关内容,分享在学习过程中的读书笔记!期待您的关注,欢迎一起学习交流进步!我的知乎主页: https://www.zhihu.com/people/MicrostrongAI/activities...原创 2020-02-11 15:18:09 · 5685 阅读 · 0 评论 -
深入理解LightGBM
我的个人微信公众号: Microstrong微信公众号ID: MicrostrongAI微信公众号介绍: Microstrong(小强)同学主要研究机器学习、深度学习、计算机视觉、智能对话系统相关内容,分享在学习过程中的读书笔记!期待您的关注,欢迎一起学习交流进步!我的知乎主页: https://www.zhihu.com/people/MicrostrongAI/activities...原创 2020-01-04 23:13:38 · 4960 阅读 · 2 评论 -
深入理解XGBoost
我的个人微信公众号: Microstrong微信公众号ID: MicrostrongAI微信公众号介绍: Microstrong(小强)同学主要研究机器学习、深度学习、计算机视觉、智能对话系统相关内容,分享在学习过程中的读书笔记!期待您的关注,欢迎一起学习交流进步!我的知乎主页: https://www.zhihu.com/people/MicrostrongAI/activities...原创 2019-12-22 19:18:10 · 4518 阅读 · 6 评论 -
深入理解GBDT多分类算法
我的个人微信公众号: Microstrong微信公众号ID: MicrostrongAI微信公众号介绍: Microstrong(小强)同学主要研究机器学习、深度学习、计算机视觉、智能对话系统相关内容,分享在学习过程中的读书笔记!期待您的关注,欢迎一起学习交流进步!我的知乎主页: https://www.zhihu.com/people/MicrostrongAI/activities...原创 2019-11-30 23:16:41 · 2293 阅读 · 1 评论 -
深入理解GBDT二分类算法
我的个人微信公众号: Microstrong微信公众号ID: MicrostrongAI微信公众号介绍: Microstrong(小强)同学主要研究机器学习、深度学习、计算机视觉、智能对话系统相关内容,分享在学习过程中的读书笔记!期待您的关注,欢迎一起学习交流进步!我的知乎主页: https://www.zhihu.com/people/MicrostrongAI/activities ...原创 2019-11-14 02:33:34 · 12435 阅读 · 7 评论 -
深入理解GBDT回归算法
我的个人微信公众号: Microstrong微信公众号ID: MicrostrongAI微信公众号介绍: Microstrong(小强)同学主要研究机器学习、深度学习、计算机视觉、智能对话系统相关内容,分享在学习过程中的读书笔记!期待您的关注,欢迎一起学习交流进步!我的知乎主页: https://www.zhihu.com/people/MicrostrongAI/activities ...原创 2019-10-27 03:00:01 · 4823 阅读 · 5 评论 -
梯度提升(Gradient Boosting)算法
我的个人微信公众号:Microstrong微信公众号ID: MicrostrongAI微信公众号介绍: Microstrong(小强)同学主要研究机器学习、深度学习、计算机视觉、智能对话系统相关内容,分享在学习过程中的读书笔记!期待您的关注,欢迎一起学习交流进步!我的知乎主页: https://www.zhihu.com/people/MicrostrongAI/activities ...原创 2019-10-13 22:50:50 · 3486 阅读 · 2 评论 -
处理不均衡数据(Dealing with imbalanced data)简洁版
(1)想办法获取更多的数据。前段时期的数据,较多呈现红色部分的数据较少呈现蓝色部分的数据;后半时期,产生数据的趋势发生变化,较多呈现蓝色部分数据较少呈现红色部分数据。所以,想办法获取更多的数据。(2)换个评判方式通常我们会用精度(Accuracy)和错误率(error)来评价模型的好坏。这两个指标在数据不均衡时,均不能客观的衡量模型。解决办法:通过Confusion Matrix,计算查准率(Pr...原创 2018-05-01 18:06:58 · 2090 阅读 · 0 评论 -
用Tensorflow训练线性模型拟合一条直线的例子
本文代码是观看这个链接:https://morvanzhou.github.io/tutorials/machine-learning/tensorflow/2-2-example2/视频后的笔记。# 加载tensorflow和numpy两个模块import tensorflow as tfimport numpy as np# creat data'''使用 numpy 来创建我们的数...原创 2018-05-01 20:41:15 · 1270 阅读 · 0 评论 -
Tensorflow中Session会话控制
Session是Tensorflow为了控制和输出文件的执行语句。运行Session.run()可以获得你想要的运算结果。举个例子:用Tensorflow实现两个矩阵相乘,并输出结果。首先,我们先加载Tensorflow,然后建立两个matrix,输出两个matrix相乘的结果。因为product是直接计算的步骤,所有我们要使用Session来激活product,并得到计算结果。import te...原创 2018-05-02 19:41:47 · 930 阅读 · 0 评论 -
Tensorflow中Variable变量
在Tensorflow中,定义了某字符串变量,它才是变量,这一点与Python不同。定义语法:sate = tf.Variable()例子:写一个累加器。import tensorflow as tfstate = tf.Variable(3, name="counter")# print(state.name)# 定义常量oneone = tf.constant(1)# 定义加法步骤...原创 2018-05-02 20:10:35 · 1224 阅读 · 0 评论 -
Tensorflow中可视化好助手Tensorboard(二)
Tensorflow中可视化好助手Tensorboard(一)中,已经讲过如何可视化TensorBoard整个神经网络结构的过程。其实TensorBoard还可以可视化训练过程(weights、biase和outputs变化过程)。本篇文章,讲解一下可视化训练过程的图片如何产生。首先,看效果图:我们实现的神经网络还是《用Tensorflow构建一个神经网络》中的神经网络。图1:神经网络中weigh...原创 2018-05-06 21:10:03 · 438 阅读 · 0 评论 -
【错误率、精度、查准率、查全率和F1度量】详细介绍
关注微信公众号【Microstrong】,我现在研究方向是机器学习、深度学习,分享我在学习过程中的读书笔记!一起来学习,一起来交流,一起来进步吧!本文同步更细在我的微信公众号中,公众号文章地址:https://mp.weixin.qq.com/s?__biz=MzI5NDMzMjY1MA==&mid=2247484127&idx=1&sn=9e59dc3f6f8a152e6...原创 2018-04-14 10:44:05 · 43201 阅读 · 9 评论 -
最优化理论与方法-牛顿迭代法后续
关注微信公众号【Microstrong】,我现在研究方向是机器学习、深度学习,分享我在学习过程中的读书笔记!一起来学习,一起来交流,一起来进步吧!本文同步更新在我的微信公众号里,地址:https://mp.weixin.qq.com/s?__biz=MzI5NDMzMjY1MA==&mid=2247484108&idx=1&sn=dbafbcd5cf6db99c7c2aa1...原创 2018-04-06 22:20:18 · 2173 阅读 · 0 评论 -
最优化理论与方法-牛顿迭代法
关注微信公众号【Microstrong】,我现在研究方向是机器学习、深度学习,分享我在学习过程中的读书笔记!一起来学习,一起来交流,一起来进步吧!本文同步更新在我的微信公众号里,地址:https://mp.weixin.qq.com/s?__biz=MzI5NDMzMjY1MA==&mid=2247484083&idx=1&sn=29d8e300fbfbd4daf2df45...原创 2018-04-06 22:21:21 · 17148 阅读 · 0 评论 -
机器学习中Bias(偏差)和Variance(方差)
先占个坑吧!慢慢补!原创 2018-04-05 20:45:35 · 2429 阅读 · 0 评论 -
58一面面试题总结
(1)Xgboost与GBDT的区别?(2)讲一下GBDT算法?(3)决策树中ID3、C4.5、CART算法一个一个讲解?(4)ID3、C4.5、CART算法区别和联系?(5)决策树是如何解决过拟合问题的?(6)SVM如何解决过拟合问题?(7)SVM如何做到多分类的?(8)快速排序手写代码?package interview;public class interview_quicksort58...原创 2018-03-28 10:24:55 · 2039 阅读 · 0 评论 -
新手最容易混淆的概念最小二乘法
我一直很困惑“最小二乘法”、“梯度下降法”、“最大似然估计法”到底是机器学习中求解参数的方法,还是最优化的方法?(1)狭义的最小二乘法,是线性假设下的一种有闭式解的参数求解方法,最终结果为全局最优;(2)梯度下降法,是假设条件更为广泛(无约束)的,一种通过迭代更新来逐步进行的参数优化方法,最终结果为局部最优;(3)广义的最小二乘准则,是一种对于偏差程度的评估准则,本质上一种目标函数(objecti...原创 2018-04-15 20:10:10 · 2245 阅读 · 0 评论 -
ROC曲线和AUC面积理解
关注微信公众号【Microstrong】,我现在研究方向是机器学习、深度学习,分享我在学习过程中的读书笔记!一起来学习,一起来交流,一起来进步吧!本文同步更新在我的微信公众号中,公众号文章地址:https://mp.weixin.qq.com/s?__biz=MzI5NDMzMjY1MA==&mid=2247484146&idx=1&sn=963765a3ede231292...原创 2018-04-15 10:08:58 · 88431 阅读 · 3 评论 -
机器学习中【回归算法】详解
关注微信公众号【Microstrong】,我写过四年Android代码,了解前端、熟悉后台,现在研究方向是机器学习、深度学习!一起来学习,一起来进步,一起来交流吧!本文同步更新在我的微信公众号里,地址:https://mp.weixin.qq.com/s?__biz=MzI5NDMzMjY1MA==&mid=2247483935&idx=1&sn=5e1c55c76...原创 2018-01-20 13:58:08 · 33207 阅读 · 0 评论 -
Tensorflow中placeholder传入值
placeholder是Tensorflow中的占位符,暂时存储变量。Tensorflow如果想从外部传入data,那就必须要用到tf.placeholder(),然后以这种形式传输数据:sess.run(***,feed_dict={input1:data1,input2:data2})例子:用Tensorflow实现两个数字相乘。import tensorflow as tfinput1 ...原创 2018-05-02 20:50:30 · 1822 阅读 · 0 评论 -
L0范数、L1范数和L2范数的区别
我的个人微信公众号:Microstrong微信公众号ID:MicrostrongAI公众号介绍:Microstrong(小强)同学主要研究机器学习、深度学习、计算机视觉、智能对话系统相关内容,分享在学习过程中的读书笔记!期待您的关注,欢迎一起学习交流进步!知乎专栏:https://zhuanlan.zhihu.com/MicrostrongGithub:https://githu...原创 2018-05-03 11:44:43 · 51339 阅读 · 4 评论 -
深入理解提升树(Boosting tree)算法
我的个人微信公众号:Microstrong微信公众号ID:MicrostrongAI微信公众号介绍: Microstrong(小强)同学主要研究机器学习、深度学习、计算机视觉、智能对话系统相关内容,分享在学习过程中的读书笔记!期待您的关注,欢迎一起学习交流进步!我的知乎主页: https://zhuanlan.zhihu.com/MicrostrongGithub: https://gi...原创 2019-10-05 15:30:07 · 4691 阅读 · 0 评论 -
【机器学习】【深度学习】【人工智能】【算法工程师】面试问题汇总(持续更新)
微信公众号1. 算法【1】动态规划经典题目总结2. 数据结构2.1 数组和字符串【1】【算法】删除一个数组中为0的元素【2】牛客网在线编程专题《剑指offer-面试题34》丑数【3】牛客网在线编程专题《剑指offer-面试题4》替换空格【4】牛客网在线编程专题《剑指offer》(1)二维数组中的查找2.2 链表【1】牛客网在线编程专题《剑指offer-面试...原创 2018-12-21 23:01:24 · 3650 阅读 · 1 评论 -
关于jieba分词的用法
import jieba_fast as jiebajieba.dt.tmp_dir = tmp_pathjieba.load_userdict(data_path)jieba这个一定要设置,不然每次都会在tmp目录里新建文件原创 2018-10-29 14:00:12 · 541 阅读 · 0 评论 -
关于SVM的文章
【1】支持向量机(SVM)入门理解与推导【2】机器学习中的算法(2)-支持向量机(SVM)基础原创 2018-10-17 21:03:45 · 1331 阅读 · 0 评论 -
EM算法详解
"微信公众号" 目录1. 摘要2. EM算法简介3. 预备知识3.1 极大似然估计(1)问题描述(2)用数学知识解决现实问题(3)最大似然函数估计值的求解步骤3.2 Jensen不等式...原创 2018-08-20 22:51:57 · 4061 阅读 · 3 评论 -
贝叶斯分类器
"微信公众号" 本文同步更新在我的微信公众号里,地址:https://mp.weixin.qq.com/s/jfQNQ0mMe7a-k3IQNL_YAg本文同步更新在我的知乎专栏里,地址:https://zhuanlan.zhihu.com/p/4048...原创 2018-07-27 22:22:41 · 26435 阅读 · 11 评论 -
主成分分析(PCA)原理详解
“微信公众号”本文同步更新在我的微信公众号里,地址:https://mp.weixin.qq.com/s/Xt1vLQfB20rTmtLjiLsmww本文同步更新在我的知乎专栏里面:主成分分析(PCA)原理详解 - Microstrong的文章 - 知乎https://zhuanlan.zhihu.com/p/377770741.相关背景在许多领域的研究与应用中,通常需要对含有多个变量的数据进行观...原创 2018-06-09 15:08:25 · 657180 阅读 · 84 评论 -
机器学习中SVD总结
本文同步更新在我的微信公众号里。地址:https://mp.weixin.qq.com/s/Dv51K8JETakIKe5dPBAPVg本文同步更新在我的知乎专栏里面:机器学习中SVD总结 - Microstrong的文章 - 知乎https://zhuanlan.zhihu.com/p/370385421.矩阵分解1.1 矩阵分解的作用. 矩阵填充(通过矩阵分解来填充原有矩阵,例如协同过滤的AL...原创 2018-05-21 00:22:16 · 4248 阅读 · 1 评论 -
Tensorflow中过拟合
一、引言我们先用生活中的一个例子来比喻一下过拟合现象。说白了,就是机器学习模型过于自信,已经到了自负的阶段。那自负的坏处,大家也知道,就是在自己小的圈子里表现非凡,不过在现实的大圈子里却往往处处碰壁。所以在这个简介里,我们把自负和过拟合画上等号。二、回归分类的过拟合机器学习模型的自负又表现在那些方面呢?这里是一些数据,如果要你画一条线来描述这些数据,大多数人都会蓝线,这条线也是我们希望机器能学出来...原创 2018-05-13 11:48:04 · 2009 阅读 · 2 评论 -
Tensorflow中Classification分类学习
这次我们会介绍如何使用Tensorflow解决Classification(分类)问题。在之前的文章中介绍的都是Regression(回归)问题。分类和回归的区别在于输出变量的类型上。通俗理解定量输出是回归,或者说是连续变量预测;定性输出是分类,或者说是离散变量预测。如预测房价这是一个回归任务;把东西分成几类,比如猫狗猪牛,就是一个分类任务。一、MNIST数据。首先准备数据(MNIST库)from...原创 2018-05-12 13:36:43 · 2127 阅读 · 0 评论 -
分类中解决类别不平衡问题
关注微信公众号【Microstrong】,我现在研究方向是机器学习、深度学习,分享我在学习过程中的读书笔记!一起来学习,一起来交流,一起来进步吧!本文同步更新在我的微信公众号里面,公众号文章地址:https://mp.weixin.qq.com/s?__biz=MzI5NDMzMjY1MA==&mid=2247484313&idx=1&sn=568015a62bf99ca5...原创 2018-05-11 22:19:31 · 53109 阅读 · 4 评论 -
K-means算法优化(二分K-means算法)
关注微信公众号【Microstrong】,我写过四年Android代码,了解前端、熟悉后台,现在研究方向是机器学习、深度学习!一起来学习,一起来进步,一起来交流吧!本文同步更新在我的微信公众号里,地址:https://mp.weixin.qq.com/s?__biz=MzI5NDMzMjY1MA==&mid=2247484014&idx=1&sn=516cdf9ec7730...原创 2018-03-18 23:20:50 · 2730 阅读 · 1 评论 -
机器学习中的L1和L2正则化项
关注微信公众号【Microstrong】,我写过四年Android代码,了解前端、熟悉后台,现在研究方向是机器学习、深度学习!一起来学习,一起来进步,一起来交流吧!本文同步更新在我的微信公众号里,地址:https://mp.weixin.qq.com/s?__biz=MzI5NDMzMjY1MA==&mid=2247483962&idx=1&sn=ce7e07e056cb1...原创 2018-03-04 14:50:46 · 8000 阅读 · 0 评论 -
聚类算法之K-means算法
目录:(1) 理解相似度度量的各种方法与相互联系(熟悉闵可夫斯基距离,其他作为了解)(1) 掌握K-means聚类的思路和使用条件 (一) 聚类的定义聚类就是对大量未知标注的数据集,按数据的内在相似性将数据集划分为多个类别,使类别内的数据相似度较大而类别间的数据相似度较小。聚类是无监督学习。 (二) 相似度、距离计算方法总结相似度跟距离是相反的概念。如果两个样本Xi与Xj ...原创 2018-03-10 16:54:34 · 1357 阅读 · 0 评论 -
我的2017总结
元旦的时候,趁着放假休息,出去游玩了一圈。昨天还在归程,今天正式开工。虽说错过新年的第一个工作日,还是要总结一下过去的2017年。总结一下自己过去的一年,是为了更好的前行。总结过去的经验教训是为了2018年更好的发展。下面,我就按四个季度回顾一下2017年的工作。回顾之前,先把我的2017年大部分书籍,给大家看一下哈!第一季度(1月-3月)当时,原创 2018-01-03 18:12:40 · 1683 阅读 · 2 评论 -
《TensorFlow实战》第一章-TensorFlow基础读书笔记
关注微信公众号【Microstrong】,我写过四年Android代码,了解前端、熟悉后台,现在研究方向是机器学习、深度学习!一起来学习,一起来进步,一起来交流吧! 最近买了一本《TensorFlow 实战》黄文坚、唐源著。感觉只看书,不写代码不记笔记,没有收获。所以,还是边看书,边记录了一下读书笔记。这是这本书第一章节的读书笔记。欢迎大家批评指正!1.原创 2017-12-21 11:40:23 · 6750 阅读 · 0 评论 -
OCR识别技术
关注微信公众号【Microstrong】,我写过四年Android代码,了解前端、熟悉后台,现在研究方向是机器学习、深度学习!一起来学习,一起来进步,一起来交流吧!最近看了一篇自动代码生成的文章《Reverse Engineering Mobile Application User Interfaces With REMAUI》,里面用到了OCR和Computing Vis原创 2017-12-25 22:28:48 · 2052 阅读 · 0 评论 -
神经网络中Epoch、Iteration、Batchsize相关理解和说明
微信公众号看了半年论文,对这三个概念总是模棱两可,不是很清楚。所以呢!我就花了半天时间,收集网上写的很好的关于这三个概念的介绍,把他们总结到一起,希望能对大家有帮助!batchsize:中文翻译为批大小(批尺寸)。简单点说,批量大小将决定我们一次训练的样本数目。batch_size将影响到模型的优化程度和速度。为什么需要有Batch_Size:batchsize的正...原创 2017-11-21 22:59:49 · 128165 阅读 · 23 评论