![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
深度学习
文章平均质量分 66
weixin_40293999
前几年web后端,后来AI深度学习,会一些运维。 AI聚焦于CV领域,熟悉nlp
展开
-
【深度学习】transform 学习代码能跑通,但未完全掌握,上面记录了自己的疑问点
问题1:不是说能够并行么,为什么答案还需要一个个的蹦出来?@todo 核心问题。问题2:teacher force的策略选择问题。原创 2024-07-18 23:44:21 · 76 阅读 · 0 评论 -
【深度学习】lstm many to many 可以跑通的代码,回归模型【未完全完成,有瑕疵】
另外,这份代码中,缺少了overlap的考虑,只考虑了时间窗口,lookback和lookforward的,而没有考虑overlap,但考虑overlap的数据构造器还没想明白【待续】两种写法的区别是啥,在比较多的情况下没区别,但到最末了,可能不够8个了,强行搞成8个是不对的。只要了最后的5个神经单元的输出,每个有8个输出。就是这个1,50 造成的错误。是用了一个非常讨巧的方式。原创 2024-07-17 14:09:50 · 167 阅读 · 0 评论 -
【深度学习】再次学习lstm,能够跑通的回归任务【history 5 future 1】many-to-one
然后将按照这个输入和输入进行整改,train过程中计算loss损失的是这样的。再看一下type的使用,torch.Tensor,是把他转成了float32.另外,predictions的输出是个二维的数据,另外需要。相当于是拿过去5天的数据预测第6天的数据,每天一个元素。这个detach,是只计算数值不要梯度。这两个本质是一个东西,会返回True。是不是的要回来看看是怎么回事。原创 2024-07-16 22:42:27 · 77 阅读 · 0 评论 -
[深度学习]transformer的详解(未完)
【代码】[深度学习]transformer的详解(未完)原创 2024-07-11 22:43:36 · 107 阅读 · 0 评论 -
labelme 标注检查经验
2. 目录另存为会找到classes.txt的类,然后标注起来。原创 2024-07-11 16:08:33 · 116 阅读 · 0 评论 -
【深度学习】vscode 命令行下的debug
其实我一直知道vscode可以再命令行下进行debug。以前的做法是 去aaa.py 写死bb和cc。我不知道他是如何传进来的参数。args 写上你自己的参数。就更加不知道如何写死了。然后直接f5调试即可。然后直接debug。原创 2024-07-06 16:36:26 · 217 阅读 · 0 评论 -
【深度学习】pytorch训练中的一个大坑
所以,深度学习级别的hello world 用plk存储文件是有道理的,为了不让他那么碎啊 =====个人理解啊。iostat -d -x -k 1 10 #查看设备使用率(%util)、响应时间(await)等详细数据, 每1s收集1次数据,总共收集10次。drqm/s:每秒从磁盘请求丢弃的请求数量(合并丢弃请求/秒)rrqm/s:每秒从磁盘请求读取的请求数量(合并读请求/秒)wrqm/s:每秒从磁盘请求写入的请求数量(合并写请求/秒)d/s:每秒向设备发出的丢弃请求的数量(数据丢失/秒)原创 2024-07-01 23:46:16 · 290 阅读 · 0 评论 -
【深度学习】tensorboard的使用
4.tensorboard 查询训练记录的功能。原创 2024-06-27 09:08:25 · 248 阅读 · 0 评论 -
【深度学习】交叉熵和MSE的理解
因此,对于回归问题而言,最好可以用卷积来取代线性层!只要维度合适,都能计算。原来,他们与维度无关,原创 2024-06-22 19:01:37 · 113 阅读 · 0 评论 -
【深度学习】--情感分类-附带全套代码(网络结构:编码+全连接)
【代码】【深度学习】--情感分类-附带全套代码(网络结构:编码+全连接)原创 2024-06-21 00:27:52 · 155 阅读 · 0 评论 -
[深度学习]--分类问题的排查错误的流程
原因复现:原生的.pt 好使, 转化后的 CoreML不好使, 分类有问题。yolov8 格式的支持情况这里可以看到CoreML 只支持cpu, 尼玛tflite也是只支持cpu的报错的这句话值得看一眼:sklearn不支持,tensorflow和torch没测试过,可能会有问题。先跑跑再说吧所以还要降级,真是麻烦,tensorflow是因为要转android侧的模型。这里要给个参数,来指定cpu复现这意思是不能用pytorch 跑了吗?原创 2024-06-17 13:23:06 · 500 阅读 · 0 评论 -
【python c++ 混合开发】pybind11
学习资料发现:https://leohsiao.com/Python/%E6%B7%B7%E5%90%88%E5%BC%80%E5%8F%91/pybind11.html。原创 2024-06-12 05:55:05 · 109 阅读 · 0 评论 -
【深度学习】N-gram模型
简单地说,语言模型就是用来计算一个句子的概率的模型,也就是判断一句话是否合理的概率?当然,一开始人们都是进行基于规则的语言模型的研究,但这样往往有很大的问题,后来有人发明了基于统计的语言模型,并发现了其巨大的效果,而今天我们要讲的N-gram语言模型,也正是一种于基于统计的语言模型。N-gram语言模型可以说是当下应用最广的语言模型,当然了,随着深度学习的发展,现在也有用RNN/LSTM这样的神经网络语言模型,效果比N-gram有时候要更好一些,但RNN解码出每一个词都得现算语言模型分数,有较慢的劣势。原创 2024-06-10 21:32:01 · 513 阅读 · 0 评论 -
【深度学习】- 视频下载(油管和b站)
有的url是这样的,https://www.youtube.com/shorts/OQjY0ihigPo。可以写成程序的方式,但因为git打不开,自行解决吧。这样的有问题,要把&pp=xxxx给删掉,其实这个可以用程序一起处理。原创 2024-06-07 14:11:54 · 410 阅读 · 0 评论 -
【深度学习】温故而知新4-手写体识别-多层感知机+CNN网络-完整代码-可运行
为什么第一轮训练train_acc要比test_acc掉点不少,是因为第一轮,是刚开始,train按批次比完了,才会到test。因为即使train是按批次的,但仍然有可能过拟合,契合的好。所以test是比不过的。对比一下 cnn的到了98.9,而mlp的只有97.x。那么为什么其它轮,又是test比train低呢?只需要将model换一下,其它的毛也不需要动。函数式API的调用方式。原创 2024-06-03 13:25:06 · 178 阅读 · 1 评论 -
【深度学习】plt.xlabel ‘str‘ object is not callable
因为已经将plt.xlable 赋值为了 ‘x‘ 字符串,所以自然就’str’ object is not callable。原创 2024-06-02 18:23:06 · 263 阅读 · 0 评论 -
【深度学习】温故而知新3 HR数据集二分类
【代码】【深度学习】温故而知新3 HR数据集二分类。原创 2024-06-01 21:26:01 · 275 阅读 · 0 评论 -
【深度学习】温故而知新2
这一行要好好琢磨一下,是啥意思!原创 2024-05-26 18:26:25 · 174 阅读 · 0 评论 -
【深度学习】复习温故而知新1
数据集ref:https://raw.githubusercontent.com/justinge/pic-go-for-xbotgo/master/Income1.csv。原创 2024-05-26 12:36:55 · 276 阅读 · 0 评论 -
【python】知识汇总
有的时候,做数据集处理的时候容易产生这种需要。每次,觉得学的挺好的时候,就会被来一闷棍。原创 2024-05-21 17:35:45 · 248 阅读 · 0 评论 -
【环境相关】告别Jupyter Notebook,我能用VSCode跑.ipynb文件啦!
ref:https://blog.csdn.net/m0_62517792/article/details/134131700原创 2024-05-20 09:27:44 · 111 阅读 · 0 评论 -
【深度学习】--slowfast视频理解数据集处理pipeline
缺点,这两个都没有 排除帧,所谓排除帧, 就是所有帧里面都是有目标的。这样的话,就会造成后面的配置文件有个别文件不起作用。谁知道哪两个文件有排除帧,欢迎评论区见。主要是采样目标后还要还原,还原的不对当下不知道,得训练的时候才知道,而且没法和原来的数据做对比。将配置文件需要的文件都裁切成只包含后面这两个文件,这里面坑很多,我是试出来的,所以记录一下。我要是现在linux上打开就好了,光挨个窜这几个文件窜了2天哎!我的这个文件,能够一键生成目标数据集的配套内容。打开视频汇总的文件,挑两个下载。原创 2024-05-10 14:59:44 · 313 阅读 · 0 评论 -
【深度学习】环境搭建ubuntu22.04
解决方案:https://forums.developer.nvidia.com/t/verify-cudnn-install-failed/167220/4。cudann安装:https://docs.nvidia.com/deeplearning/cudnn/installation/linux.html。报错:https://forums.developer.nvidia.com/t/verify-cudnn-install-failed/167220。cudnn测试通过,它被安装在了src下。原创 2024-04-08 10:33:01 · 451 阅读 · 0 评论 -
安装Nvidia驱动出现 cc: error: unrecognized command-line option ‘-ftrivial-auto-var-init=zero’
安装Nvidia驱动出现 cc: error: unrecognized command-line option ‘-ftrivial-auto-var-init=zero’报错:cc: error: unrecognized command-line option ‘-ftrivial-auto-var-init=zero’需要 gcc-12 才能正确编译。原创 2024-04-07 21:36:00 · 1354 阅读 · 0 评论 -
【深度学习】图片预处理,分辨出模糊图片
论文 ref:https://www.cse.cuhk.edu.hk/leojia/all_final_papers/blur_detect_cvpr08.pdf。遇到模糊的图片,还要处理一下,把它挑出来,要么修复,要么弃用。根据模糊值排序即可,写在文件名中,自动排序,然后对模糊的去掉即可。我感觉300,400的阈值,就会好很多了。本质是一个拉普拉斯变换!原创 2024-03-27 16:35:46 · 418 阅读 · 0 评论 -
【人脸检测】retinaface 的训练过程记录【未完】
看一下detect.py文件改一下就好了。里面提供了预训练模型。原创 2024-03-26 18:31:29 · 150 阅读 · 0 评论 -
【深度学习】四种天气分类 模版函数 从0到1手敲版本
print(x.size()) 这里是可以计算出来的,需要掌握计算方法定义网络total = 0model,train_dl,test_dl)比较重要的点,1.分类的数据集布局要记住2.图片经过conv2 多次后的值要会算 todo3.图片展示的方法要会。原创 2024-03-23 22:27:43 · 525 阅读 · 0 评论 -
【深度学习】知识点归纳总结-for 面试【自用】
首先,解码器输入一个特殊的单词,即句子开头的单词对应的词向量(这个特殊的单词一般标记为<SOS>,即Start Of Sentence),输出第一个预测的单词。前两个张量(Q,K)的作用根据查询张量获取每个键张量的对应的分数,然后根据分数计算出对应的权重,用得到的权重乘以值(V)张量,并对值张量加权平均,最后输出结果。通过在编码器的输出和下一步的输入中引入上下文的信息,最后达到让解码器的某一个特定的解码和编码器的一些输出关联起来,即对齐(Alignment)的效果。所以相较于LSTM,他的计算量是增加的。原创 2024-03-05 11:34:18 · 434 阅读 · 0 评论 -
【深度学习】马尔科夫链
(2) 独立增量过程为马尔可夫过程:没{X(t),t∈[0,+∞)}为一独立增量过程,且有P(X(0)=x0)=1,x0为常数,则X(t)为马尔可夫过程。也就是状态转移的概率确定的前提下,和初始概率无关,(5) 质点随机游动过程为马尔可夫过程。(1) 独立随机过程为马尔可夫过程。(3) 泊松过程为马尔可夫过程。(4) 维纳过程为马尔可夫过程。原创 2024-01-28 15:18:09 · 671 阅读 · 0 评论 -
【深度学习】语言模型与注意力机制以及Bert实战指引之二
这一篇是bert实战的完结篇,准备中。原创 2023-12-20 15:05:21 · 279 阅读 · 0 评论 -
【深度学习】语言模型与注意力机制以及Bert实战指引之一
用过 Word2Vec 的小伙伴应该比较清楚,在 Word2Vec 中,对于同一个词语,它的向量表示是固定的,这也就是为什么会有那个经典的“国王-男人+女人=皇后”的计算式了,但有个问题,“苹果”可能是水果,也可能是手机品牌。如果还是用同一个向量表示,就有偏差了,而BERT可以根据上下文的不同,对同一个token给出的词向量是动态变化的,很灵活。它对网络中的输入(或者中间层)的不同位置,给予了不同的注意力或者权重,然后再通过学习,网络就可以逐渐知道哪些是重点,哪些是可以舍弃的内容了。原创 2023-12-20 08:30:00 · 463 阅读 · 0 评论 -
【machine learning for everyone 人人都可以学的机器学习】系列文章 1【数据预处理、KNN、朴素贝叶斯、线性回归、SVM、Neural Net】
数据集:https://archive.ics.uci.edu/dataset/159/magic+gamma+telescope。原创 2023-12-14 08:45:00 · 179 阅读 · 0 评论 -
【LSTM】北京pm2.5 天气预测--pytorch版本,有代码可以跑通-LSTM回归问题,工程落地一网打尽
LSTM 少分析原理,更强调工程落地,今年年初有两篇LSTM的回归文章,是keras实现的。《【LSTM】LSTM预测股票价格–单因素、多步、输出单步回归特征 -keras 1》https://blog.csdn.net/weixin_40293999/article/details/128635150《【LSTM】多因素单步骤预测-keras 2》http://t.csdnimg.cn/vRmMeLSTM:做回归预测的几个应用。原创 2023-11-21 00:26:57 · 1690 阅读 · 2 评论 -
【informer】 时间序列的预测学习 2021 AAAI best paper
数据集 https://github.com/zhouhaoyi/ETDataset/blob/main/README_CN.md代码:https://github.com/zhouhaoyi/Informer2020#reproducibility21年的paper:https://arxiv.org/pdf/2012.07436.pdf论文在代码上有连接,貌似又出了2023的extend版本:惭愧啊,北航的paper哎…原创 2023-11-15 21:49:34 · 575 阅读 · 1 评论 -
【深度学习】Yolov8 区域计数
很长时间没有做yolov的项目了,最近一看yolov8有一个区域计数的功能,不得不说很实用啊。b站:https://www.bilibili.com/video/BV1Ng4y1d7Yr/?原创 2023-11-04 20:00:02 · 1165 阅读 · 0 评论 -
【深度学习】- NLP系列文章之 1.文本表示以及mlp来处理分类问题
torch 是做张量计算的框架,张量只能存储数字类型的值,因此无论啥样的文本(中文、英文)都不能直接用张量表示,这就引出了文本数据的表示问题,如何表示文本数据?每个较小的文本单元称为token,将文本分解成token的过程称为分词(tokenization)。词向量表示方式依赖于单词的使用习惯,这就使得具有相似使用方式的单词具有相似的表示形式。是单词的一种数值化表示方式,一般情况下会将一个单词映射到一个高维的向量中(词向量)one-hot(独热)编码和词嵌入是将token映射到向量最流行的两种方法。原创 2023-09-13 21:00:07 · 520 阅读 · 0 评论 -
【论文复现】Learning I/O Access Patterns to Improve Prefetching in SSDs 系列 1
LSTM完成ssd I/的预取git地址: https://github.com/Chandranil2606/Learning-IO-Access-Patterns-to-improve-prefetching-in-SSDs-paper地址: https://people.ucsc.edu/~hlitz/papers/ecml2020.pdf作者的presentation://www.youtube.com/watch?作者的ppt我也没有,在3中可以在线观看。原创 2023-09-04 10:22:41 · 281 阅读 · 0 评论 -
【活体检测模型】活体检测思路推演
用分类的思想做活体检测,要求准确的分出正负样本,否则,支付宝被别人用了,问题就很严重。大部分的商用场景还是 摇摇头、张张口,配合动作来做。但其实这件事很尬,尤其是人多的时候。所以分类上有所突破是关键。数据集:CASIA-SURF dataset如何提升准确度?原创 2023-08-28 22:52:44 · 155 阅读 · 0 评论 -
【yolov8+人/车流量统计】yolov8案例的追踪case,业务化可以变成计数,bz=4,同时追踪4路摄像头,只用一个检测模型
之前写个yolov8的一个试用版,【深度学习】Yolov8追踪从0到1, 这要是做计数啥的,简单的一批,一套工程化的代码,给自己挖了个坑,说要实现一个基于yolov8的人/车流量统计.现在要改进,想要做成能够处理多摄像头的,也就是多个摄像头共享一个算法来处理计数。原创 2023-07-31 11:08:15 · 3280 阅读 · 4 评论 -
【深度学习】以图搜索- 2021sota repVgg来抽取向量 + facebook的faiss的做特征检索, 从环境搭建到运行案例从0到1
Faiss的全称是Facebook AI Similarity Search。这是一个开源库,针对高维空间中的海量数据,提供了高效且可靠的检索方法。暴力检索耗时巨大,对于一个要求实时人脸识别的应用来说是不可取的。而Faiss则为这种场景提供了一套解决方案。Faiss从两个方面改善了暴力搜索算法存在的问题:降低空间占用加快检索速度首先,Faiss中提供了若干种方法实现数据压缩,包括PCA、Product-Quantization等。原创 2023-07-26 17:01:39 · 848 阅读 · 0 评论