算法
文章平均质量分 86
龙海L
金牛座理工男,请多多指教,多多打赏点赞
展开
-
python时间序列异常检测库ADTK,风控算法工程师的福音
文章目录adtk简介数据要求异常特征加工滑动窗口adtk简介智能运维数据基本上都是时间序列形成的,时间序列数据的异常检测是风控算法的重要组成部分,而可以调用ADTK库完成基本的算法,和大家分享该库的使用。adtk(Anomaly Detection Toolkit)是无监督异常检测的python工具包,它提供常用算法和处理函数:简单有效的异常检测算法异常特征加工处理流程控制安装:pip install sdtk数据要求时间序列的数据主要包括时间和相应的指标(cpu,内存等),py.原创 2021-07-30 17:03:14 · 5320 阅读 · 2 评论 -
深度多模态子空间聚类网络+代码实现
文章目录网络概述(论文)引言Deep Subspace Clustering Networks(基于稀疏和低秩表示的深度子空间聚类)基于空间融合的多模态子空间聚类基于亲和融合的深度多模态子空间聚类代码详解模型定义模型训练网络概述(论文)相关论文资源:在我的资源中,请关注我然后下载。共三篇论文:Deep Subspace Clustering NetworksDeep Multimodal Subspace Clustering NetworksCross-Modal Subspace Clust原创 2021-04-17 17:06:37 · 4722 阅读 · 5 评论 -
2021年找工作经验分享,避坑
实习暑期实习一般转正较多,一般从三月份,暑期实习就可以开始投递面试。所以刷题尽量从十二月就开始。暑期实习面试对项目经历要求较少,扎实的刷题能力至关重要。数据库,操作系统,计算机网络这类基础,可以根据自己投递的岗位侧重的复习。实习要找你最理想的职位,这样会为你秋招打分许多。实习岗位和你秋招岗位不同,也是也分加分选项。如果想去阿里,实习可谓是一个捷径。项目项目不要求创新,可行性最重要。笔试大厂(阿里,腾讯,百度)较为侧重创新新,都是查不到的题目。基础要扎实再去笔试,中厂一般收拾基本都可以找到原题。懂原创 2021-04-05 21:32:02 · 218 阅读 · 0 评论 -
多模态融合技术综述和应用
文章目录多模态技术基础1,多模态融合架构(神经网络模型的基本结构形式)1.1联合架构1.2协同架构1.3编解码架构(自监督)2,多模态融合方法2.1早期融合2.2 晚期融合2.3混合融合3,模态对齐方法3.1显式对齐方法3.2隐式对齐方法4,开放数据与资源应用1:多模态摘要(综合多模态信息生成内容摘要)多模态摘要种类多模态表示基础多模态中的注意力机制多模态词表示(用非语言特征:视频、音频调整词语的表示 )教学型视频摘要多模态新闻摘要论文 Multi-model Summarization for Async原创 2020-12-03 11:58:14 · 29413 阅读 · 14 评论 -
面试问题决策树合集
文章目录1. ID3、C4.5和CART三种决策树的区别一、决策树的优点和缺点二、决策树思想及生成过程三,前后剪枝区别四,决策树优缺点:五,Random Forest Vs Bagging:XGBOOST和GDBT的区别xgboost,rf,lr优缺点有哪些?xgboost和lightgbm的区别和适用场景GDBT的原理,以及常用的调参参数AdaBoost和GBDT的区别GBDT推导gbdt推导和适用场景说一下gbdt的全部算法过程随机森林和 GBDT 的区别stacking和blending的区别?附加原创 2020-11-04 16:37:50 · 1639 阅读 · 0 评论 -
算法工程师面试基础题目及答案
深度学习卷积类卷积神经网络的特点有哪些卷积深度可分离卷积1*1卷积的作用深度学习基础BN的原理,作用和实现细节优点:1)加快训练速度,这样我们就可以使用较大的学习率来训练网络。2)提高网络的泛化能力。解决过拟合3)BN层本质上是一个归一化网络层,可以替代局部响应归一化层(LRN层)。4)可以打乱样本训练顺序(这样就不可能出现同一张照片被多次选择用来训练)论文中提到可以提高1%的精度。BN层的输出Y与输入X之间的关系是:Y = (X - running_mean) / sqr原创 2020-10-13 21:58:57 · 6157 阅读 · 0 评论 -
注意力机制attention和Transformer
参考文献:https://zhuanlan.zhihu.com/p/146130215文章目录一,注意力机制二,自注意力(self-attention)三,软注意力机制1,空域注意力2,通道注意力机制3,混合域模型4,Non-Local5,位置注意力机制四,强注意力机制一,注意力机制attention 机制可以认为是一种资源分配的机制,可以理解为对于原来平均分配的资源根据对象的重要程度重新分配资源,重要的单位多分一点,不重要不好的的少分一点,attention的资源分配方式就是权重。视觉注意力分为几原创 2020-09-30 19:59:56 · 7827 阅读 · 1 评论 -
Long-Tail(长尾)问题的解决方案
长尾问题在实际的视觉相关问题中,数据都存在长尾分布:少量类别占据绝大多数样本,大量的类别仅有少量的样本,比如open-images,ImageNet等。解决长尾问题嘚方案一般分为4种:1,Re-sampling:主要是在训练集上实现样本平衡,如对tail中的类别样本进行过采样,或者对head类别样本进行欠采样;2,Re-weighting:主要在训练loss中,给不同的类别的loss设置不同的权重,对tail类别loss设置更大的权重3,Learning strategy(阶段训练):有专门为解决原创 2020-09-11 10:33:21 · 13471 阅读 · 2 评论 -
电竞数据开源
数据地址:链接: https://pan.baidu.com/s/1d5Xm-nmIltZ8h6_0KHGd5A 提取码: fbbd数据说明:数据标注了主播,友方,敌方的血条,还有击杀提醒,广播提醒,主播英雄头像和技能框。可以作为目标检测的数据,检测这些目标的位置,具体应用大家可以自己创新。制作不易,希望大家支持。...原创 2020-07-05 18:16:27 · 290 阅读 · 0 评论 -
机器学习学习笔记-西瓜书
误差函数1.0-1损失函数2.平方损失函数:最小二乘法的具体表现,误差分布满足正态分布3.绝对损失函数4.对数损失函数怎样选择?监督学习有两种策略:经验最小化和结构风险最小化当样本容量小时,经验风险最小化的策略容易产生过拟合的现象。结构风险最小化可以防止过拟合。结构风险最小化是在经验风险的基础上加上表示模型复杂度的正则化项或罚项:卷积池化后的图像大小计算设图像尺寸为WxW,卷积核尺...原创 2020-07-04 17:19:17 · 759 阅读 · 0 评论 -
数据比赛代码记录
数据比赛里用写的代码,可快速应用到其他比赛使用库数据处理特征工程模型训练和预测使用库import pandas as pdimport numpy as npfrom sklearn.model_selection import StratifiedKFold #数据进行交叉验证的,模型选择时使用from lightgbm import LGBMClassifier#lightgbm做分类的模型from lightgbm import LGBMRegressor#lightgbm做回归预测fr原创 2020-05-29 20:58:51 · 207 阅读 · 0 评论 -
时间序列网络RNN,LSTM入门
文章目录RNNRNN解决问题示例:语句情感分析传统方法问题:长句子,参数过多 (改进:使用参数共享,每个单词的特征提取方式一致)没有上下句的语境信息 (改进:需要长期的记忆模块)改进的模型:h0h_0h0为初始化数据共享的参数:whhw_{hh}whh和wwhw_{wh}wwh;最后输出可以是最后的节点,也可以将所有的记忆节点综合输出,比较灵活。最后的实际模型为:其中:激活函数使用tanh()tanh()tanh()函数输出yty_tyt也可以将所有的hth_原创 2020-05-25 21:15:41 · 1037 阅读 · 1 评论 -
公司真题刷题记录Python
文章目录贪心算法贪心算法资源配置,收益最大化小Q的公司最近接到m个任务, 第i个任务需要xi的时间去完成, 难度等级为yi。小Q拥有n台机器, 每台机器最长工作时间zi, 机器等级wi。对于一个任务,它只能交由一台机器来完成, 如果安排给它的机器的最长工作时间小于任务需要的时间, 则不能完成,如果完成这个任务将获得200 * xi + 3 * yi收益。对于一台机器,它一天只能完成一个...原创 2020-06-18 12:06:46 · 628 阅读 · 0 评论 -
R-cnn目标检测系列阅读笔记
文章目录了解下R-CNN理解R-CNNFAST R-CNNFaster R-CNN-加速区域提案Mask R-CNN-扩展Faster R-CNN用于像素级分割了解下R-CNNR-CNN:区域CNN。主要论文:R-CNN: https://arxiv.org/abs/1311.2524Fast R-CNN: https://arxiv.org/abs/1504.08083Fa...原创 2020-04-20 00:55:15 · 2111 阅读 · 0 评论 -
YOLOv3论文翻译
文章目录摘要介绍解决方案效果如何我们尝试但没有作用的工作研究意义论文地址:https://arxiv.org/pdf/1804.02767.pdf摘要我们为YOLO提供一些更新!我们做了一些小的设计上的改变来使它更好。我们还培训了这个非常棒的新网络。它比上次大了一点,但更准确。不过还是很快的,别担心。在320×320 YOLOv3运行在22毫秒在28.2mAP,像SSD准确度,但是它的三倍的...原创 2020-04-15 11:29:40 · 326 阅读 · 0 评论 -
YOLOv2论文翻译
文章目录摘要简介怎样达到更好怎样达到更快怎样达到更稳健总结论文地址:https://arxiv.org/pdf/1612.08242.pdf题目:YOLO9000:Better, Faster, Stronger从题目可以看出,作者其实将第二代成为YOLO9000 实时目标检测系统摘要我们介绍了YOLO9000,这是一种先进的实时对象检测系统,可以检测9000多个对象类别。首先,我们建...原创 2020-04-15 11:29:04 · 335 阅读 · 0 评论 -
PyTorch入门,帮你构建自己的神经网络模型
文章目录张量 tensor自动求导神经网络的构建图像分类器(实战宝可梦)迁移学习数据并行处理 使用 GPUPytorch 综合评价:所以当前学pytorch 最合适,等待tensorflow 2的生态完善,Tensorflow1和2完全不兼容Pytorch 生态也比较完善功能:GPU加速自动求导: autugrad,grad函数神经网络:全连接层nn.linear,卷积层nn.co...原创 2020-03-07 16:51:16 · 1084 阅读 · 0 评论 -
图像分类数据集制作 SVM/DNN
方法综述简单的图像分类可以采用HOG+SVM的算法,通过提取图像的HOG特征,然后特征通过SVM进行分类,实现图像的分类。下面将代码的步骤讲清楚提取HOG特征#一种自定义的方法def get_features(img): #腐蚀后 锐化 #腐蚀 im_gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)#灰度图形 im=cv2...原创 2020-03-06 23:05:18 · 2222 阅读 · 0 评论 -
“《王者荣耀》游戏的无监督精彩片段检测”论文解读
文章目录摘要介绍数据集模型结果总结摘要随着电子竞技直播的日益流行,精彩时刻回放已经成为直播平台的一个重要功能,它在几秒钟内聚合了整个激动人心的战斗场景。在这篇论文中,我们介绍了一种新的训练策略,它不需要任何额外的注解来自动生成游戏视频的亮点。考虑到现有的手动编辑剪辑比长游戏直播视频包含更多的亮点,我们在编辑过的剪辑和长时间直播视频之间执行两两排序约束。提出了一种多流融合框架,用于融合视频中提取...原创 2020-03-05 21:50:55 · 1081 阅读 · 0 评论 -
YOLO系列网络原理
文章目录初代YOLO算法优点算法结构网络结构YOLOv2YOLOv3初代YOLO论文地址:https://arxiv.org/abs/1506.02640研究代码地址:https://pjreddie.com/darknet/yolo/算法优点1,速度非常快,在Titan X GPU上的速度是45fps(一秒钟45张图像)2,基于图像的全局信息进行预测的,与Fast R-CNN相比,Y...原创 2020-02-26 22:01:10 · 3143 阅读 · 0 评论 -
传统推荐系统方法理论
传统推荐系统方法理论文章目录传统推荐系统方法理论基于内容的推荐系统的原理基于矩阵分解的推荐系统的原理基于商品的协同过滤的推荐系统的原理基于用户的协同过滤的推荐系统的原理冷启动问题如何评估推荐系统的性能以及这些算法的优缺点混合算法推荐系统评估使用矩阵分解构建电影推荐系统电影推荐系统原理:需要数据:电影评分表 电影内容矩阵基于内容的推荐系统的原理代价函数基于矩阵分解的推荐系统的原理电影...原创 2020-01-07 10:38:43 · 1153 阅读 · 0 评论 -
左神教程 排序算法代码C++实现
左神教程 代码C++实现归并排序冒泡排序选择排序快速排序 优化版随机向量产生器判断两相等是否相等主函数:包含对数器归并排序//1.内排序,指所有数据已经读入内存,在内存中进行排序的算法。排序过程不需要对磁盘进行读写。//外排序:内存中无法保存全部数据、需要进行磁盘访问,每次读入部分数据到内存进行排序//a,merge sort "分而治之",o(nlogn) 空间o(n)void m...原创 2019-12-18 15:04:36 · 691 阅读 · 0 评论