huahuahuahhhh-CSDN博客

原创 torch.split与torch.chunk的用法及区别

当split_size_or_sections 为list时，那么tensor结构会一共切分成len(list)这么多的小块，每个小块中的大小按照list中的大小决定，其中list中的数字总和应等于该维度的大小，否则会报错（，正好匹配，那么ouput就是大小相同的块结构。dim上数据的长度不能被。：切分后块结构 <class ‘tuple’>：需要切分的大小(int or list )为int时，tenor结构和。整除，余下的部分会少一些。作用将tensor按照。：input，待分输入。

2024-08-01 09:32:39 155

原创使用python推理tflight(包括int8)模型

【代码】使用python推理tflight(包括int8)模型。

2024-07-29 17:51:50 160

原创使用gradio搭建服务(三)--多轮对话

对象保存每轮对话中用户的提问和大语言模型的回复。

2024-07-24 16:49:56 271

原创 pycharm专业版破解及连接到远程环境

pycharm破解参考https://blog.csdn.net/weixin_59047731/article/details/135634418打开专业版pycharm，设置interpreter选项。原因：ssh插件没有装。参考https://blog.csdn.net/z929162742/article/details/119153636?spm=1001.2101.3001.6650.5&utm_medium=distribute.pc_relevant.none-task-blog

2024-06-16 17:40:07 320

原创使用gradio搭建服务(二)--逐步执行

这里通过设置两个按钮，来分布执行不同的功能。使用gradio搭建逐步执行的服务。

2024-06-16 15:55:36 244

原创文本读取时的乱码/报错

一批txt文档，有多种编码方式，怎么读取呢？

2024-04-16 15:10:22 171

原创 pytorch训练模型时加log

中添加需要跟踪的变量的值，这里的。

2024-04-15 14:48:05 276

原创 jsonl文件介绍

要将数据保存为 .jsonl 格式的文件，你需要确保每条数据都是一个有效的 JSON 对象，并且将每个对象转换为 JSON 字符串后逐行写入文件。在 .jsonl 文件中，每一行包含一个完整的 JSON 对象，这些对象之间通过新行（换行符）分隔。.jsonl每一行都是一个独立的 JSON 对象，可以单独解析。这种格式特别适合日志数据、大型数据集、流数据处理以及需要增量加载或存储的场景。jsonl 文件格式是 JSON Lines 的缩写，它是一种文本格式，用于存储结构化数据，类似于 JSON。

2024-03-11 11:31:28 2529

原创通过base64，实现图片与字符串的互相转换

【代码】通过base64，实现图片与字符串的互换。

2024-03-04 17:01:54 363

原创 re-captioning技术是什么

模型对图片进行caption操作时，输出的标题一般描述图片中的主体，而。

2024-02-17 17:56:12 638

原创多输入的pytorch模型转成onnx模型，及多输入的onnx模型推理

pytorch模型使用3种分辨率的输入图片，输入图片的分辨率分别为。

2024-01-31 10:25:53 531

原创转yolov5模型时，不转后处理部分

由于部署在硬件上的时候，后处理部分硬件处理不支持，需要挪到cpu上处理。320的，检测头删掉了40。将坐标变换部分跳过，不执行。

2024-01-26 11:19:33 472

原创 Eyes Wide Shut? Exploring the Visual Shortcomings of Multimodal LLMs

论文中指出，上面这些VQA问题，人类可以瞬间给出正确的答案，但是多模态给出的结果却是错误的。是哪个环节出了问题呢？还是视觉特征与语言模型间的特征没有对齐？作者将上述问题分成了9个类别（通过将涉及的问题和选项提供chatgpt,让chatgpt将这些问题归类）上图种左边是目前的多模态结构，中间部分是两部分特征线性相加，右边是交错混合的方式。为了评价多模态模型在这些任务上的表现，建立了MMVP-VLM的测试集。探索多模态模型种视觉编码器的缺陷。通过增加自监督特征，多模态模型的能力有了提升。

2024-01-20 16:32:52 839

原创 labelme读取文件顺序

labelme的目录结构。

2024-01-03 10:34:32 559

原创多进程读取图片

多进程读取图片，查看图片的尺寸h,w是否为(1080,1920)

2023-12-21 10:22:00 413

原创 tmux+conda环境配置不对问题解决

参考。

2023-12-20 19:10:09 550

原创 shell中的sort和uniq命令

的文本，当重复的行并不相邻时，uniq 命令是不起作用的。先对文本进行排序，然后执行。统计每行文本出现的次数。uniq的操作对象是。

2023-12-18 15:45:33 451

原创网页中的json文档，怎么保存到本地

点击右边的三条横线——>另存页面为。

2023-12-01 11:35:28 3385

原创使用tensorflow2.15.0版跑bert模型遇到的问题记录

函数)，遇到的一些问题记录。使用官方的bert模型。

2023-11-30 09:35:38 932

原创 pandas(八)--实战一下

收到一批数据，数据形式。采集数据的间隔时间是10分钟，全天采集数据，每天的数据量是144条。

2023-11-28 11:49:03 502

原创时间数据与字符串间相互转换

【代码】时间数据与字符串间相互转换。

2023-11-28 10:32:59 483

原创多模态模型的语言幻觉和视觉幻觉

语言幻觉”是一种不基于感官输入的感知，而“视觉幻觉”是对正确感官输入的误解文章中设计了一系列的能表现语言幻觉和视觉幻觉的实验，共200对图像-问题-答案对。包括表格、地图、海报、视频帧等，以及修改后的图片，这些修改的图片只有小幅的修改，但是对于同一问题的答案是完全不同的。这些实验分为两大类视觉依赖型和视觉辅助型。视觉依赖型的问题的答案与图片的内容强相关（比如：图片的左上角是什么？）视觉补充型是一些常识型的问题（比如：提供一张中国地图，问上海和北京两个城市的面积，哪个更大）

2023-11-02 17:02:36 395

原创 torch.distributed.elastic.multiprocessing.api: [ERROR] failed (exitcode: -7)

在docker中运行时，由于配置的共享内存不足导致。新建docker时，

2023-10-31 14:39:49 1868

原创新建包含cuda和cudnn的docker

背景：服务器的cudnn版本太低了，没有权限去修改。故新建包含cuda和cudnn的docker步骤。

2023-10-31 11:17:23 1034 4

原创在pycharm中创建python模板文件

在文本框中输入模板内容。

2023-10-23 16:16:34 1292

原创混淆矩阵绘制

【代码】混淆矩阵绘制。

2023-10-20 18:30:20 525

原创 BLIP2模型加载在不同设备上

现在大语言模型越来越大，占用的内存越来越多，这导致内存较小的设备无法体验大模型的效果。放在0号显卡上，其余模型放在cpu上。模型的名称在模型的index文件中。提供了将一个大模型分别加载在gpu和cpu上的方法。

2023-10-08 17:35:10 725

原创关于睡眠的知识

白天活跃的突触比较多，晚上的少一些。晚上相当于是在“洗脑”。白天一直活跃的突触好比一直在运行的电脑，如果一直不睡觉，内存会满溢，晚上休息相当于是清理内存。

2023-09-19 09:24:38 148

原创 numpy.array形式的字典数据转成python类型的字典数据

你可以使用 ast.literal_eval() 函数将字符串转换为 Python 字典。首先，将 numpy.ndarray 对象转换为字符串，然后使用 ast.literal_eval() 函数将其转换为字典。

2023-08-17 16:12:02 759

原创多模态模型评价

在选择图片中不存在的物品时，有3种方式“Random Sampling”、“Popular Sampling”和“Adversarial Sampling”。即，LVLM(Large Vision-Language Models)倾向于生成与描述中的目标图像不一致的对象。这篇文章主要是评价视觉-语言模型中出现“幻觉”的评价。（POPE，基于轮询的对象探测评估）。

2023-08-10 10:51:05 272