机器学习
文章平均质量分 81
AI算法网奇
本人曾是一名普通会计,自学编程和算法,15年封闭苦学,现在是一名资深算法工程师,CSDN博客专家。
本人将多年的工作经验整理出来,从入门知识到高阶技巧,乃至最前沿研究成果,皆有分享,为国内IT行业自强之路,尽个人微薄之力。
展开
-
因果推理学习笔记
因果推理学习笔记入门理解:聊聊因果推理、反事实逻辑和Do-calculus - 知乎微软开源 DoWhypython对行为进行推理_微软开源了专注于因果推理的框架DoWhy_三更寒天的博客-CSDN博客DoWhy除了为常见的因果推断方法提供一个程序设计界面,DoWhy的设计还是为了显示常被忽略的因果分析假设。所以,DoWhy的特点之一就是会让潜在的假设更容易理解。另外,DoWhy可以进行敏感度分析和其他鲁棒性检查。我们的目的是让人们关注他们在对因果推断做假设时的思考而不是其中原创 2021-11-26 01:09:27 · 2095 阅读 · 0 评论 -
使用python线性规划学习总结
1.pulp例子:https://blog.csdn.net/MartaYang/article/details/71439074https://blog.csdn.net/cyuhong/article/details/50865909https://www.cnblogs.com/shizhenqiang/p/8274806.html2.python-p...原创 2018-04-15 22:35:58 · 7260 阅读 · 0 评论 -
生成模型与判别模型
生成模型与判别模型原创 2017-09-23 15:33:41 · 3063 阅读 · 0 评论 -
java pca资料整理
java pca资料整理原创 2017-04-06 23:27:18 · 3055 阅读 · 1 评论 -
几种常见模式识别算法整理和总结
这学期选了门模式识别的课。发现最常见的一种情况就是,书上写的老师ppt上写的都看不懂,然后绕了一大圈去自己查资料理解,回头看看发现,Ah-ha,原来本质的原理那么简单,自己一开始只不过被那些看似formidable的细节吓到了。所以在这里把自己所学的一些点记录下来,供备忘,也供参考。1. K-Nearest NeighborK-NN可以说是一种最直接的用来分类未知数转载 2015-09-02 09:50:09 · 1543 阅读 · 0 评论 -
python概率计算
python概率计算原创 2017-09-19 19:42:10 · 7280 阅读 · 0 评论 -
机器学习之用Python从零实现贝叶斯分类器
机器学习之用Python从零实现贝叶斯分类器原创 2017-09-19 19:26:31 · 2978 阅读 · 0 评论 -
独立事件与非独立事件,条件概率
独立事件与非独立事件,条件概率原创 2017-09-19 19:08:30 · 27310 阅读 · 0 评论 -
随机森林原理
随机森林原理原创 2017-09-19 22:36:29 · 3621 阅读 · 0 评论 -
对于随机森林的通俗理解
对于随机森林的通俗理解转载 2017-09-19 22:07:04 · 2982 阅读 · 0 评论 -
Hungarian method 匈牙利算法 解决指派问题
在生活中经常遇到这样的问题,某单位需完成n项任务,恰好有n个人可承担这些任务。由于每人的专长不同,各人完成任务不同(或所费时间),效率也不同。于是产生应指派哪个人去完成哪项任务,使完成n项任务的总效率最高(或所需总时间最小)。这类问题称为指派问题或分派问题。Hungarian method (匈牙利算法)----解决指派问题(转)---匈牙利解法是求解指派问题的一种新颖而又简便的解法。---指派问题的最优解有这样一个性质,若从系数矩阵的一行(列)各元素中分别减去该行(列)的最小元素..原创 2020-09-20 22:36:01 · 4610 阅读 · 0 评论 -
通俗解释卡尔曼滤波
参考:https://know.baidu.com/wenda/question/info?qid=082891072f23cff634ad19fea197c689ffbf008假设你有两个传感器,测的是同一个信号。再假设你知道其中贵的那个传感器应该准一些,便宜的那个应该差一些。那有比取平均更好的办法吗?加权平均。怎么加权?假设两个传感器的误差都符合正态分布,假设你知道这两个正态分布的方...原创 2019-10-04 22:08:10 · 3146 阅读 · 1 评论 -
Kaggel实战:识别手写体[knn改进算法]
2017年07月11日 21:53:30 howhigh 阅读数 218版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/howhigh/article/details/74999555说明未采用sklearn自带的knn算法(当时得分96.800%)进行建模改进大神的代码(96.400% )提高到96.886%代码fro...转载 2019-07-13 10:51:28 · 2414 阅读 · 0 评论 -
最短路径-Dijkstra算法与Floyd算法
最短路径-Dijkstra算法与Floyd算法原文:https://www.cnblogs.com/smile233/p/8303673.html一、最短路径 ①在非网图中,最短路径是指两顶点之间经历的边数最少的路径。AE:1 ADE:2 ADCE:3 ABCE:3 ②在网图中,最短路径是指两顶点之间经历的边上权值之和最短的路径。...原创 2019-03-24 17:33:50 · 2490 阅读 · 0 评论 -
机器学习-数据归一化方法(Normalization Method)
机器学习-数据归一化方法(Normalization Method)原文:https://blog.csdn.net/program_developer/article/details/78637711出现背景:从左至右来看,第一个模型是一个线性模型,拟合度很低,也称作欠拟合(Underfitting),不能很好地适应我们的训练集;第三个模型是一个高次方的模型,属于过度拟合,虽然能...转载 2019-01-02 23:55:05 · 2745 阅读 · 0 评论 -
2018年视觉所有干货博文的分类汇总
原文:转载自 我爱计算机视觉https://mp.weixin.qq.com/s?__biz=MzIwMTE1NjQxMQ==&mid=2247485040&idx=1&sn=60029335b3641e01d60004bdbdb7e541&chksm=96f37424a184fd328569d11c4534acfbfa0cb286c65ac639b613301...转载 2019-01-01 23:27:29 · 2980 阅读 · 0 评论 -
数据降维与可视化——t-SNE
数据降维与可视化——t-SNE原文:https://blog.csdn.net/hustqb/article/details/78144384声明:manifold:可以称之为流形数据。像绳结一样的数据,虽然在高维空间中可分,但是在人眼所看到的低维空间中,绳结中的绳子是互相重叠的不可分的。 参考sklearn官方文档 对数据降维比较熟悉的朋友可以看这篇博客 t-SNE实践——s...原创 2019-01-01 23:21:10 · 3462 阅读 · 0 评论 -
NMS和soft-nms算法
NMS和soft-nms算法nms :iou阈值的作用,如果iou大于阈值,则认为是两个框是同一个物体,所以会删除分数小的框。https://blog.csdn.net/eurus_/article/details/84251975以此图为例,传统的NMS,首先选定一个IOU阈值,例如为0.25。然后将所有4个窗口(bounding box)按照得分由高到低排序。然后选中得分最高的窗口...原创 2018-09-18 14:04:52 · 5802 阅读 · 0 评论 -
vibe+ 笔记
vibe release版需要3ms左右。这个vibe+版本,debug版需要200msrelease需要60mshttps://github.com/jacke121/BackgroundSplit-OpenCV5. ViBe的改进算法ViBe+笔者对ViBe+进行了学习研究,博客地址如下:《论文翻译:ViBe+算法(ViBe算法的改进版本)》笔者已经将把源...原创 2018-08-29 15:04:33 · 3857 阅读 · 2 评论 -
向量检索 HNSW nmslib
https://github.com/nmslib/hnswhttps://github.com/nmslib/nmslibpip install nmslib这个会自动安装 pip install pybind11,结果报错:没有安装成功装这个成功了:pip install nmslib==1.7 nmslib.cc(16): fatal error C1083...原创 2018-07-31 19:52:19 · 8765 阅读 · 1 评论 -
高维空间最近邻逼近搜索算法评测
高维空间最近邻逼近搜索算法评测 最近邻方法是机器学习中一个非常流行的方法,它的原理很容易理解:邻近的数据点是相似的数据点,更可能属于同一分类。然而,在高维空间中快速地应用最近邻方法,却是非常有挑战性的工作。全球最大的流媒体音乐服务商Spotify需要向上面的海量用户推荐音乐,其中就用到了最近邻方法。也就是在高维空间、大型数据集上应用最近邻方法。由于维度高、数据规模大,直接应用最近邻...原创 2018-07-31 18:18:28 · 3369 阅读 · 0 评论 -
运动目标检测、阴影检测及目标跟踪中用得到的标准测试视频下载
运动目标检测、阴影检测及目标跟踪中用得到的标准测试视频下载原创 2017-11-11 09:42:27 · 3369 阅读 · 0 评论 -
运动检测(前景检测)之——ViBe
运动检测(前景检测)之——ViBe这个也是c++ 代码:https://download.csdn.net/download/zhuangxiaobin/7360113 目前前景检测的研究还是很多的,也出现了很多新的方法和思路。个人了解的大概概括为以下一些: 帧差、背景减除(GMM、CodeBook、 SOBS、 SACON、 VIBE、 W4、多帧平均……)、光流(稀疏光流、...原创 2017-11-11 09:40:24 · 2979 阅读 · 0 评论 -
凸包问题的五种解法
凸包问题的五种解法转载 2017-11-09 23:31:48 · 3264 阅读 · 0 评论 -
机器学习系列之EM算法
机器学习系列之EM算法原创 2017-11-09 14:35:39 · 3288 阅读 · 0 评论 -
高斯混合模型的终极理解
高斯混合模型的终极理解原创 2017-11-09 14:06:16 · 2873 阅读 · 0 评论 -
K-means算法、高斯混合模型 matlab
K-means算法、高斯混合模型 matlab原创 2017-11-09 14:04:13 · 3446 阅读 · 0 评论 -
高斯混合模型--GMM(Gaussian Mixture Model)
高斯混合模型--GMM(Gaussian Mixture Model)原创 2017-10-26 23:31:36 · 4226 阅读 · 0 评论 -
机器学习算法之决策树
机器学习算法之决策树转载 2017-10-20 00:24:09 · 2721 阅读 · 0 评论 -
Haar Adaboost 视频车辆检测代码和样本
Haar Adaboost 视频车辆检测代码和样本原创 2017-11-13 22:51:32 · 5291 阅读 · 0 评论 -
线性代数的本质 - 02 - 线性组合、张成的空间与基
学习网站整理原创 2017-11-04 21:20:56 · 2844 阅读 · 0 评论 -
卷积神经网络「失陷」,CoordConv来填坑
卷积神经网络「失陷」,CoordConv来填坑2018-07-13 11:56选自Uber作者:Rosanne Liu等卷积神经网络拥有权重共享、局部连接和平移等变性等非常优秀的属性,使其在多种视觉任务上取得了极大成功。但在涉及坐标建模的任务上(如目标检测、图像生成等),其优势反而成为了缺陷,并潜在影响了最终的模型性能。Uber 在这项研究中揭示出问题的本质就在于卷积的平移等变性,并据此提出了对应...原创 2018-07-15 11:01:11 · 2936 阅读 · 0 评论 -
高清变脸更快更逼真!比GAN更具潜力的可逆生成模型来了 | OpenAI论文+代码
高清变脸更快更逼真!比GAN更具潜力的可逆生成模型来了 | OpenAI论文+代码Glow的作者是来自OpenAI的两位:Diederik P. Kingma、Prafulla Dhariwal。而且OpenAI这次一口气放出了Glow的论文以及代码。论文传送门:https://d4mucfpksywv.cloudfront.net/research-covers/glow/paper/glow....转载 2018-07-10 19:53:23 · 2674 阅读 · 0 评论 -
海量数据分类 liblinear使用总结
liblinear使用总结liblinear是libsvm的线性核的改进版本,专门适用于百万数据量的分类。正好适用于我这次数据挖掘的实验。 liblinear用法和libsvm很相似,我是用的是.exe文件,利用python的subprocess向控制台发送命令即可完成本次试验。 其中核心两句即train train.txtpredict test.txt train.txt.model outp...转载 2018-07-02 17:30:33 · 3550 阅读 · 0 评论 -
阿里开源自主研发的 DFSMN 语音识别模型,引谷歌论文引用
近日,阿里巴巴达摩院机器智能实验室语音识别团队,推出了新一代语音识别模型—— DFSMN,不仅被谷歌等国外巨头在论文中重点引用,更将全球语音识别准确率纪录提高至 96.04%(基于世界最大的免费语音识别数据库LibriSpeech)。阿里在GitHub平台上开源了自主研发的DFSMN语音识别模型这支平均年龄只有 30 岁的团队还宣布,即日起向全世界企业与个人开源此次打破全球语音识别纪录的 DFSM...转载 2018-06-10 21:59:31 · 4394 阅读 · 0 评论 -
机器学习:多分类的logistic回归
机器学习:多分类的logistic回归Multi-Class Logistic(多分类的Logistic问题) 它适用于那些类别数大于2的分类问题,并且在分类结果中,样本x不是一定只属于某一个类可以得到样本x分别属于多个类的概率(也可以说样本x的估计y符合某一个几何分布),这实际上是属于Generalized Linear Model中讨论的内容。考虑一个结论:如果一个分类问题符合几...转载 2018-06-11 10:58:56 · 11888 阅读 · 1 评论 -
pywt 安装学习
安装:conda install -c conda-forge pywaveletsgithub地址,里面有demohttps://github.com/PyWavelets/pywt这个是学习笔记https://blog.csdn.net/nanbei2463776506/article/details/64124841这个是一个demo:#!/usr/bin/env python# -*- ...原创 2018-05-04 16:28:09 · 14839 阅读 · 0 评论 -
最短路径的Dijkstra算法(邻接表)
原文:http://blog.csdn.net/axiqia/article/details/50984464描述 以邻接表作为存储结构实现,求解从给定源点到给定结束点的最短路径。 输入从1开始表示第一个节点。第一行输入:顶点数n(2<=n<=100),边数m(2<=m<=100)第二行输入有向边:起始点s1,结束点 s2,边权值 w第三行输入:源点start,终点e...转载 2018-02-17 11:55:53 · 5497 阅读 · 0 评论 -
em 聚类资料收集
Em聚类算法: 自己造数据:https://github.com/1092798448/EM-GMM/blob/master/GMM.py https://github.com/go2chayan/GMM_using_EM/blob/master/progAss4.py 只有一个文件https://github.com/yunsangq/GMM-EM-KMeans原创 2018-01-28 23:12:14 · 2621 阅读 · 0 评论 -
余弦计算相似度度量
余弦计算相似度度量原创 2017-10-19 22:04:54 · 3720 阅读 · 0 评论