机器学习
文章平均质量分 71
about AI, machine learning
HackerTom
https://github.com/iTomxy
展开
-
matplotlib twinx多y轴但单个图例
matplotlib 多 y 轴,但图例画在一起原创 2024-06-15 10:54:21 · 345 阅读 · 0 评论 -
pytorch分布式训练DDP代码模板
PyTorch DDP 分布式训练代码模板原创 2024-04-15 00:51:18 · 419 阅读 · 0 评论 -
scipy beta分布与numpy clip的数值问题
scipy.beta.pdf 与 numpy.clip 的数值稳定性原创 2024-04-12 22:25:40 · 839 阅读 · 0 评论 -
skimage求凸包、包络
scikit-image 求凸包、包络 mask原创 2024-03-26 12:51:08 · 217 阅读 · 0 评论 -
条件随机场(CRF)笔记
条件随机场(CRF)用作语义分割 refinement原创 2024-03-19 19:32:49 · 855 阅读 · 0 评论 -
matplotlib画堆叠、并列直方图
matplotlib 画堆叠、并列分布直方图展示分量分布原创 2024-03-17 16:30:14 · 537 阅读 · 0 评论 -
PyTorch Dataset、DataLoader长度
pytorch 求数据集大小原创 2024-03-15 12:53:45 · 829 阅读 · 0 评论 -
pytorch续写tensorboard
PyTorch resume 训练时续写 tensorboard log原创 2024-03-04 18:20:41 · 685 阅读 · 0 评论 -
pytorch nearest upsample整数型tensor
手写 pytorch upsample 支持整数型输入原创 2024-01-29 20:10:50 · 501 阅读 · 0 评论 -
《Learning to Reweight Examples for Robust Deep Learning》笔记
元学习,unroll gradient graph、backward-on-backward 理解原创 2024-01-22 21:55:22 · 1102 阅读 · 0 评论 -
pytorch一致数据增强—独用增强
改进 pytorch 一致增强,支持独用 augmentation原创 2024-01-14 20:45:12 · 674 阅读 · 0 评论 -
pytorch一致数据增强
对多幅图做一致的数据增强原创 2023-12-10 14:34:15 · 2482 阅读 · 1 评论 -
matplotlib legend写tex公式且控制字体
matplotlib legend 写 tex 公式原创 2021-01-18 21:36:48 · 7050 阅读 · 0 评论 -
MMWHS数据集
MMWHS 数据集笔记原创 2023-10-20 20:29:56 · 2940 阅读 · 5 评论 -
医疗图像分割指标
medical image segmentation metrics原创 2023-09-28 17:08:46 · 1818 阅读 · 2 评论 -
《Data Cleansing for Models Trained with SGD》笔记
方阵 Loewner 偏序直观理解原创 2023-09-15 21:43:13 · 330 阅读 · 0 评论 -
下载MedShapeNet
脚本下载 MedShapeNet 数据集原创 2023-08-31 10:57:04 · 186 阅读 · 0 评论 -
《Understanding Black-box Predictions via Influence Functions》笔记
《Understanding Black-box Predictions via Influence Functions》中一些数学内容的解释原创 2023-08-29 15:35:11 · 424 阅读 · 0 评论 -
EM算法估计beta混合模型参数
EM 算法用最大似然求 Beta mixture model 参数原创 2023-08-24 09:45:27 · 575 阅读 · 0 评论 -
multi-view clustering指标
multi-view clustering 指标原创 2023-06-29 21:36:14 · 331 阅读 · 0 评论 -
pytorch分布式卡住
pytorch 分布式训练卡住原创 2023-05-23 01:19:05 · 1150 阅读 · 0 评论 -
diffusion models笔记
diffsution model 笔记原创 2022-12-10 01:24:29 · 846 阅读 · 0 评论 -
torchvision transforms自动clip图像数值范围坑
torchvision.transforms 自动 clip PIL.Image 的值范围导致出错原创 2022-11-12 12:27:53 · 640 阅读 · 1 评论 -
depth estimation笔记
depth estimation 笔记原创 2022-10-08 15:11:58 · 946 阅读 · 0 评论 -
《A Metric Learning Reality Check》笔记
[1] 是 metric learning 的一篇学术打假文,回顾了 deep metric learning 领域两个经典工作(contrastive loss,triplet loss)和近年来(2017 ~ 2019,见文中 Table 6)的几篇工作,指出近年一些工作其实有些作弊行径,其提出的 loss 带来的实际增长其实没有文中号称的那么多,非常硬核。作者按照他认为公平的方式重新实验比较这些 losses,并有提供 benchmarks 的代码,见 [2]。一作 github 主页见 [3]。原创 2020-05-09 22:04:00 · 1560 阅读 · 1 评论 -
mmdetection用mmclassification的backbone
MMDetection 调用 MMClassification 中 backbone 训练原创 2022-09-17 17:35:50 · 1020 阅读 · 2 评论 -
MMDetection在ScanNet上训练
用 MMDetection 在 ScanNet 训练原创 2022-09-13 18:18:08 · 1533 阅读 · 6 评论 -
装detectron2报错:nvcc fatal : No input files specified; use option --help for more information
装 detectron2 报错:nvcc fatal : No input files specified; use option --help for more information原创 2022-09-03 21:57:20 · 2465 阅读 · 0 评论 -
《High-Resolution Image Synthesis and Semantic Manipulation with Conditional GANs》笔记
Pix2PixHD 论文笔记原创 2022-08-25 21:32:10 · 184 阅读 · 0 评论 -
tensorflow clip对NaN、inf的效果
TensorFlow 的 clipping 对 inf、NaN 的效果原创 2022-07-16 18:10:50 · 980 阅读 · 0 评论 -
matplotlib用brokenaxes画断轴(broken axis)
matplotlib 画断轴(broken axis)原创 2022-04-11 20:42:15 · 6724 阅读 · 4 评论 -
matlab生成one-hot向量
对于单标签数据,其 label 可能是用一个整数表示,想转化成 one-hot label。注意原 class IDs 可能是 0-base 的,要 +1 转成 1-base。原创 2022-01-08 20:00:31 · 1089 阅读 · 1 评论 -
matlab读.h5文件
之前用 python 给 nuswide 提取了 VGG19 特征,因为文件太大,超过 .mat 限制,存成 .h5,见 [1]。现在一个 matlab 程序要读,可以用 h5disp 查看 .h5 文件内容的结构(各个 datasets),然后用 h5read 读。注意两点:文件名的类型要是 char 而不能是 string,否则报错好像被自动转置了一次?我当初存的时候应该是 n×dn\times dn×d 的,但读出来的时候变成 d×nd\times nd×n 了(不知道是 h5py[1] 在存原创 2022-01-08 19:31:35 · 7191 阅读 · 4 评论 -
手写torchvision transform
pytorch 1.4.0 和 opencv 重写 kornia 的 RandomGaussianBlur原创 2021-12-31 15:02:47 · 1983 阅读 · 0 评论 -
matlab自动深复制(deep copy)
matlab 程序中,多次重复实验,而每次重复中会对数据 X 加一些随机噪声。此处希望每次重复时深复制一次 X,使得本次的噪声不会影响原数据。matlab 似乎能自动决定要不要复制一份?测试如下。Codematlab R2018a% 原数据X{1} = reshape([1 : 1 : 9], [3, 3]);X{2} = reshape([11 : 1 : 19], [3, 3]);% "复制"一份X1 = X;% 加噪声:(伪)随机变 NaNindex{1} = [1 3];原创 2021-12-22 00:52:49 · 1507 阅读 · 0 评论 -
Pascal Sentences数据集预处理
Pascal Sentences[1] 包含来自 VOC 2008[2] 的 1000 对图文对,每幅图有 5 句描述,现参照 [3] 处理。Data数据在 [1],其中 label 是藏在 image 的链接路径中(可右键图片在新窗口打开看网址,或在浏览器 F12 打开调试查看元素)。直接保存网页,会下载得到 pascal-sentences.htm 文件、pascal-sentences_files/ 目录。其中,images 装在目录里,sentences 嵌在 html 文件中。原本(在浏览原创 2021-11-24 22:39:11 · 1879 阅读 · 1 评论 -
tensorflow清除变量和图
用 tensorflow 1 时,想要多次重复实验取平均,在两次实验之间需要清一次计算图,否则会报错说 xx 变量重复定义。代码形式:# import tensorflowclass MyModel: def __init__(self): # build model def train(self): with tf.Session() as sess: # training# 多 runs 取平均for i_run i原创 2021-11-22 21:49:25 · 1619 阅读 · 0 评论 -
matlab用字符串按名索引结构体(struct)的成员变量(field)
matlab 一个训练函数中的若干记录用一个叫 records 的结构体返回,其中包括多个 loss 的 list / vector,现用一个循环遍历这些 loss lists、画图、保存。Codegetfield 用字符串取 struct 的 fieldsaveas 保存 figure% 假装 res 是某个函数返回的结果res = struct();res.loss_1 = [1 2 3];res.loss_2 = [4 5 6];% 用字符串按名取 fieldfor k = [原创 2021-11-13 20:37:05 · 3529 阅读 · 0 评论 -
并行执行多个matlab程序(多组参数)
argument passing in command line命令行运行一个无参数的函数,如:function f() fprintf("hello world!\n");end可以执行 matlab -nodesktop -nosplash -r f。而如果要传参数,如:function g(alpha) disp(alpha);end参考 [1],执行 matlab -nodesktop -nosplash -r "g(27)",即用引号括起来。parallel t原创 2021-11-13 19:50:14 · 6853 阅读 · 0 评论 -
matlab textscan读结构化.txt文件
要用 matlab 读之前处理的 COCO 的 ID map[1],将 sample ID 映射去 image name,用来读图片。ID map 文件每一行的形如:0 9 000000000009.jpg空格间开,第一列是 sample ID,第二列是原本的 image ID,即第三列 image name 中的 ID。用 textscan[2] 函数,其中格式控制符见 [3]。Codeid_map_file = fullfile("data/COCO", "id-map.COCO.txt")原创 2021-11-12 22:53:18 · 671 阅读 · 0 评论