机器学习
龚大龙
这个作者很懒,什么都没留下…
展开
-
AI视频数字识别、分割(上)
任务描述:根据视频中的数字的变化切割视频(国网需求);夜晚热红外视频帧:根据右上角机位数字分割视频思路:视频分帧aoi区域裁剪字符分割神经网络模型训练字符识别断点确定分割视频一、视频分帧# Step1:视频读取、分帧# 1.保存视频每一秒的图面def save_image(image, addr, num): address = addr + str(num) + '.jpg' cv2.imencode('.jpg', image)[1].tofile(原创 2021-03-17 10:24:17 · 1616 阅读 · 0 评论 -
机器学习实战——笔记(线性回归之误差分析)
线性回归之误差分析首先回顾下上一节得到的曲线长这样:图来源于李宏毅大神~error主要来源于两方面:bias:标准差variance:方差简单的来理解一下bias(标准差)及variance(方差)比如:“预测宝可梦进化后的战斗力的例子”我们知道一定存在一个最佳的数学模型来预测新的“宝可梦”进化后战斗力,记为f^\hat{f}f^(这也是我们辛辛苦苦想找的)但是,我们每...原创 2019-01-16 18:14:35 · 5187 阅读 · 0 评论 -
机器学习实战——笔记(线性回归)
线性回归目录线性回归小练习把李宏毅的“宝可梦”线性回归的视频又刷了一遍~是时候记录下来啦~一、线性回归首先,什么是线性回归?无非就是一个函数f(x)=wx+bf(x)= wx+bf(x)=wx+b举个“宝可梦”的例子:小智在野外抓了一只皮卡丘,皮卡丘进化后是雷丘,小智想知道雷丘的战斗力如何?小智去问大木博士,博士只给了小智10只宝可梦的详细信息(进化前和进化后的属性...原创 2019-01-16 10:57:47 · 355 阅读 · 0 评论 -
机器学习实战——练习(kNN——手写识别系统)
kNN——手写识别系统其实上一节的 “kNN——约会网站” 已经写得非常详细了,那这一节无非就是把图片转成向量来处理。先描述下图片,图片为32*32的黑白图片训练集:2000张,每个数字包括200张测试集:900张直接上代码:# 手写识别系统# 路径大家根据实际修改def img2vector(filename): returnVect = zeros((1, 1024...原创 2019-01-09 16:59:44 · 572 阅读 · 1 评论 -
机器学习实战——练习(kNN——约会网站)
kNN——约会网站目录约会网站推荐实现过程一、约会网站推荐场景: 某屌丝使用在线约会网站来约妹,虽然网站会给他推荐人选,但他并不喜欢每个人,他交往过的分成三种类型(其实这就是标签啦):不喜欢一般般超喜欢该屌丝偷偷收集了约会者的数据,长这样:一行代表一个样本,从左往右的列数分别代表:每年获得的飞行常客里程数玩游戏所耗时间百分比每周消费的冰淇淋公升数类别标签(1...原创 2019-01-09 16:18:50 · 1336 阅读 · 0 评论 -
机器学习实战——笔记(Logistic 回归)
Logistic 回归目录logistics 概述梯度上升算法随机梯度上升算法改进的随机梯度上升算法一、logistics 概述谈到“逻辑回归”,不得不说的就是 sigmoid 函数sigmoid(z)=11+e−zsigmoid(z) = \frac{1}{1+e^{-z}}sigmoid(z)=1+e−z1函数图像:可以知道:当z=0时,s(z)=0.5当z→...原创 2019-01-20 15:58:55 · 249 阅读 · 0 评论 -
机器学习实战——笔记(K-近邻算法)
K-近邻算法目录K-近邻分类算法从文本文件中解析和导入数据使用Matplotlib创建扩散图归一化数值一、K-近邻算法概述场景一:从电影类型的分类出发,如何判断一部电影是爱情片还是动作片或者其他类型呢?是否可根据电影中出现的kiss镜头和打斗镜头数来划分呢?带着这两个问题来讲解“K-近邻算法”。K-近邻算法采用测量不同特征值之间的距离方法进行分类。优点: 精度高、对异常值...原创 2019-01-08 20:15:24 · 177 阅读 · 0 评论 -
机器学习实战——笔记(梯度下降——Gradient Descent)
梯度下降——Gradient Descent目录回顾梯度下降算法 (Gradient Descent)学习率的设置(Tuning your learning rates)随机梯度下降(Stochastic Gradient Descent)特征归一化(Feature Scaling)梯度下降算法推导(Taylor Series )一、回顾梯度下降算法公式:假设θ\thetaθ有...原创 2019-01-18 20:00:54 · 317 阅读 · 0 评论 -
机器学习实战——笔记(第一章)
机器学习基础目录机器学习的简单概述机器学习的主要任务算法选择与开发步骤Python语言的优势一、机器学习的简单概述机器学习应用领域十分广泛,如人脸识别、推荐系统、手写数字辨识及垃圾邮件过滤等。那何谓“机器学习”?简单的说“机器学习”就是将无序的数据转换成有用的信息。如:垃圾邮件过滤,一篇邮件中的某个单词不能代表该邮件的性质,但当某几个特定单词出现,再综合其他因素即可判断是否为...原创 2019-01-08 11:20:00 · 193 阅读 · 0 评论 -
机器学习实战——笔记(线性回归、梯度下降算法、Logistic回归概述)
线性回归、梯度下降算法、Logistic回归概述目录前言线性回归梯度下降算法Logistic回归一、前言刚好读到《机器学习实战》的第五章——Logistic回归,有几点疑问:回归不是说预测具体的数值,是连续的吗?难道我理解错了?挖槽,这里面好像大有学问我以前有听过随机梯度下降算法,我还知道英文名叫SGD,看了书上的梯度上升算法,表示颠覆。看了公式之后,我想知道怎么推...原创 2019-01-13 17:14:15 · 532 阅读 · 1 评论 -
机器学习实战——练习(朴素贝叶斯——从个人广告中获取区域倾向)
朴素贝叶斯——从个人广告中获取区域倾向示例:使用朴素贝叶斯分类器从个人广告中获取区域倾向Craigslist个人广告链接已经找不到了,改用该网站的社会事件event与政治politics的RSS源https://newyork.craigslist.org/search/eve?format=rss&sale_date=2018-06-11https://losangeles.cr...原创 2019-01-12 21:38:29 · 865 阅读 · 0 评论 -
机器学习实战——练习(朴素贝叶斯——垃圾邮件过滤)
朴素贝叶斯——垃圾邮件过滤描述:有50封邮件,其中垃圾邮件25封,有用邮件25封,垃圾邮件类别记为1,有用邮件类别记为0,现在需要过滤邮件。实验思路:首先,处理下邮件的形式,文本处理成向量然后,随机将邮件分成训练集和测试集,比例4:1训练集拿出来训练,得到两个类别的概率分布测试集拿出来测试,概率带进来计算类别,并计算错误率# 输入字符串,输出单词列表def textPar...原创 2019-01-12 20:31:31 · 1871 阅读 · 0 评论 -
机器学习实战——笔记(朴素贝叶斯)
朴素贝叶斯(naive bayes)目录朴素贝叶斯算法原理文本分类练习一、朴素贝叶斯——算法原理优点:在数据较少的情况下仍然有效,可以处理多分类问题缺点:对于输入数据的准备方式较为敏感适用数据类型:标称型数据首先,我们来讲一下贝叶斯决策理论的核心思想场景:假设有一个数据集,它由两类数据组成,数据分类如下:p1(x,y)表示数据点(x,y)属于红色一类的概率p2(x,...原创 2019-01-12 17:45:12 · 652 阅读 · 0 评论 -
机器学习实战——练习(决策树之Matplotlib绘制)
决策树之Matplotlib绘制在上一节我们已经学会决策树啦~但是呢结果是这样(字典形式):{‘no surfacing’: {0: ‘no’, 1: {‘flippers’: {0: ‘no’, 1: ‘yes’}}}}这节,我们把它绘制出来!首先,我们先在Matplotlib上面练练手,画个丑东西上代码:import matplotlib.pyplot as plt#...原创 2019-01-11 17:28:31 · 339 阅读 · 0 评论 -
机器学习实战——笔记(决策树)
决策树目录决策树算法原理代码实现一、决策树算法原理直接上图,直观的了解下决策树是什么?矩形:表示判断模块椭圆形:表示终止模块 我相信上图大家都看得懂吧~决策树优点: 计算复杂度不高、输出结果易于理解,对中间值的缺失不敏感,可处理不相关特征数据缺点: 可能会产生过度匹配问题适用数据范围: 数值型和标称型 信息增益决策树就是在当前数据集上依据某个决定性属性特征来划分...原创 2019-01-11 10:33:22 · 243 阅读 · 4 评论