自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

胭脂草的ABC博客

胭脂草的ABC博客

  • 博客(442)
  • 收藏
  • 关注

原创 python中[:,2] , num[:, :2] ,num[:, 2:]是什么意思

这是numpy的切片操作,一般结构如num[a:b,c:d],分析时以逗号为分隔符,逗号之前为要取的num行的下标范围(a到b-1),逗号之后为要取的num列的下标范围(c到d-1);如果是这种num[:b,c:d],a的值未指定,那么a为最小值0;如果是这种num[a:,c:d],b的值未指定,那么b为最大值;# 按步长为2取第二维的索引0到末尾之间的元素,也就是第一列和第三列。arr[:,:1] # 取第0列的数据,以。arr[:,0] # 取第0列的数据,以。arr[i, :] #取第i行数据。

2024-03-08 10:31:55 905

原创 通俗理解TP、FP、TN、FN

虽然学了很多遍,但还是经常弄混这几个概念。实在是太绕了,真真假假,假假真真。归根到底,其实是没有正确理解两个标志位的含义。

2024-03-06 16:25:23 1603

原创 Ubuntu下安装pygobject出错,No package ‘cairo‘ found

原因是缺少cairo包,运行。

2024-03-05 18:09:40 345

原创 src/pycurl.h:170:13: fatal error: openssl/crypto.h: 没有那个文件或目录

fatal error: openssl/ssl.h: No such file or directory “错误解决。要解决这个问题,你需要安装 OpenSSL 开发包,执行以下命令进行安装,然后重新编译即可解决。CentOS系统执行以下命令。Ubuntu系统执行以下命令。

2024-03-05 17:48:37 125

原创 SuperPoint和SuperGlue 的算法介绍及学习应用经验分享

假如求得的距离是所在行所在列的最小值,那么就认为这组点匹配,判定为。相乘相加的结果是最小值,这样看就和求解运输问题是一回事了。二范数:它表示为向量中各个元素的平方和的平方根。用神经网络,对特征子学习,比手工提取更好。描述子(坐标,描述周围信息的特征向量)的算法介绍及学习应用经验分享。特征点匹配,为了计算位姿。是模拟不同相机视角的变化。运输问题建模求解匹配问题。自监督,不需要手动标点。编码器解码器结构,好用。注意这个矩阵不是对称的。最终的目标是距离矩阵。

2024-03-04 15:37:07 279

原创 Stable Diffusion 一句话生成视频! 本地运行,最稳定的方法!

1.下载最新版的 Stable-diffusion :【

2024-02-23 16:28:21 692

原创 图像分割系列论文解读(一)VNet与Dice Loss

VNet网络的左侧可以看作是不同的阶段(stage),每个阶段由1-3个卷积层对不同分辨率的特征图进行操作,卷积后特征图通道数量将会增加。网络的最后一层采用soft-max,输出是前景和背景的概率。进入下一阶段是特征图的尺寸需要减小,这是通过2x2x2的卷积实现的(步长设置为2),具体如下图所示。从图像分割的发展来看,VNet这篇论文的核心贡献是验证了Dice Loss的有效性,当然它本身的创新点不只是Dice Loss。每个阶段的卷积采用的核是5x5x5,(这里的卷积应该是指特征图长宽不变对应的卷积)。

2024-02-22 17:29:23 1785

转载 多任务合一的RetinaFace: Single-shot Multi-level Face Localisation in the Wild

RetinaFace将信息量不同的任务统一为图像平面内的点回归任务。实验显示这些信息层级不同的任务在训练时可以相互促进。

2024-02-21 16:51:35 104

原创 llava1.5模型安装、预测、训练详细教程

注:host 0.0.0.0表示自动填充本机ip,网页将其替换本机ip即可,web server启动后会有网页ip,若在其它电脑将其0.0.0.0替换运行服务器的ip即可。若已完成权重下载,便可执行以下模型启动命令,而–model-path后面需跟模型权重路径文件,若联网能范文hugging face便可无需修改直接使用官方给定命令。最后,我额外说下,我使用4090显卡搭建,跑测试问题不大,大概16g左右吧,跑训练一张24G卡有些够呛。该文件可通过点击链接连接,也可在hugging face自行搜索。

2024-02-02 18:58:18 1941

转载 大规模语言LLaVA:多模态GPT-4智能助手,融合语言与视觉,满足用户复杂需求

一个面向多模式GPT-4级别能力构建的助手。它结合了自然语言处理和计算机视觉,为用户提供了强大的多模式交互和理解。LLaVA旨在更深入地理解和处理语言和视觉信息,从而实现更复杂的任务和对话。这个项目代表了下一代智能助手的发展方向,它能够更好地理解和应对用户需求。demo链接:https://llava.hliu.cc/ https://llava-vl.github.io/ 这个页面选1.6Install PackageInstall additional packages for train

2024-02-02 17:14:04 298

转载 PP-OCRv3进行OCR手写文字识别

手写体在日常生活中较为常见,无论是记笔记,亦或是手写书信,再或是现如今出现的各种电子设备也都支持手写输入,或是触摸屏输入,手写体可以说是随处可见。手写体的自动识别功能对于保存手写体的内容是极为重要的。中文汉字字符级别的类别繁多;手写体字符的书写随意性大, 缺乏规范性不同书写人书写风格多样中文汉字中存在很多相似字和易混淆的汉字对以上难点对手写体自动识别都带来了很大的挑战。

2024-02-02 15:30:51 1029

转载 基于PP-OCRv3的手写文字识别

PP-OCRv3的识别模块是基于文本识别算法SVTR优化。SVTR不再采用RNN结构,通过引入Transformers结构更加有效地挖掘文本行图像的上下文信息,从而提升文本识别能力。如下图所示,PP-OCRv3采用了6个优化策略。SVTR_LCNet:轻量级文本识别网络GTC:Attention指导CTC训练策略TextConAug:挖掘文字上下文信息的数据增广策略TextRotNet:自监督的预训练模型UDML:联合互学习策略UIM:无标注数据挖掘方案详细优化策略描述请参考。

2024-02-02 12:23:30 644

转载 本地部署体验LISA模型(LISA≈图像分割基础模型SAM+多模态大语言模型LLaVA)

我下载了LISA-13B-llama2-v0-explanatory(别下这个,我当时是因为作者只发布了两个版本,才下的,后面没用上,要下就选择v1的版本,内存大的下13B,小的下7B)释放不需要的显存:在某些情况下,可能存在一些不需要的显存被占用,可以使用torch.cuda.empty_cache() 来释放不需要的显存。之前https://www.lfd.uci.edu/~gohlke/pythonlibs/也可以下载whl,现在点进去是这样的下不了了。可以尝试减小batch_size参数的值。

2024-02-02 09:27:55 199

转载 Llava-1.5v模型部署指南

Llava是开源的多模态大模型,由威斯康星麦迪逊大学的Haotian Liu等人研发并发布,论文已中2023NIPS。

2024-02-02 09:20:58 1642

转载 如何在 Ubuntu 中安装 Microsoft Edge 浏览器

微软终于聪明了一回,也学会了「打不过就加入」。Microsoft Edge 浏览器的 Linux 稳定版已经于 2020 年 10 月 23 日发布,并提供给使用。除了官方 Edge APT 源以外,还提供了.deb和.rpm格式的安装包。Microsoft Edge 基于 Chromium 开源浏览器引擎开发,任何现代或基于 Chromium 浏览器工作的网站、Web 应用程序或 Web 服务都可以在 Microsoft Edge 中使用。与其他流行的网页浏览器,如。

2024-01-31 14:34:33 2341 2

原创 ValueError: attempted relative import beyond top-level package

看这篇文章如果还不会。。。请顺着网线来打我!!!镜像问题:(1)通过”import sys,sys.path.append('父目录的路径')“来改变,这种方法属于一次性的,只对当前的python解释器进程有效,关掉python重启后就失效了。

2024-01-30 16:46:57 1147

转载 不用梯子,GitHub也能访问并提速

GitHub加速插件顾名思义它就是一款加速GitHub下载速度的插件它可以提高Github访问速度github release、archive以及项目文件下载的加速。GitHum访问慢的原因在于域名解析那解决方案就有针对性了修改本地的hosts文件将远程DNS解析改为本地DNS解析。Github打开慢的原因其中一个原因GitHub的CDN域名遭到DNS污染无法连接使用GitHub的加速分发服务器所以国内访问速度较慢。直接下载配置好的github加速hosts文件下载完成之后直接替换本地的hosts文件。

2024-01-30 15:02:28 771

原创 在Ubuntu中修改用户名可以通过以下方法实现:

以上是两种不同的实现方法,分别是使用usermod命令修改用户名和创建一个新用户并复制数据的方式。将旧用户的数据复制到新用户中:cp -R /home/旧用户名/* /home/新用户名/使用usermod命令修改用户名,例如:usermod -l 新用户名 旧用户名。修改用户的主目录名:usermod -d /home/新用户名 -m 新用户名。修改用户组名,确保与新用户名相同:groupmod -n 新用户名 旧用户名。方法二:创建一个新用户,将旧用户的数据复制到新用户中。退出管理员权限:exit。

2024-01-29 19:18:22 5357

原创 ​ PaddleHub 首页图像 - 文字识别chinese_ocr_db_crnn_server​

chinese_ocr_db_crnn_server Module用于识别图片当中的汉字。其基于chinese_text_detection_db_server Module 检测得到的文本框,识别文本框中的中文文字。识别文字算法采用CRNN(Convolutional Recurrent Neural Network)即卷积循环神经网络。该Module是一个通用的OCR模型,支持直接预测。

2024-01-29 17:37:27 1595

原创 在Ubuntu Linux上安装Chrome浏览器的最佳方法

有数十种浏览器,甚至Linux系统如Ubuntu也带有自己的默认浏览器Mozilla Firefox。然而,许多人要么不满意它,要么只想安装他们喜欢的浏览器,如Chrome。在Linux上安装应用程序并不是一件困难的事情,但是,最好的方法是什么呢?当然是终端,因为只需几个命令就可以获取你的应用程序,包括Chrome。它是一款跨平台浏览器,也可用于Debian二进制格式。因此,在本教程中,我们不会涵盖多种在Ubuntu Linux上安装和管理Google Chrome的方法,而是介绍最佳方法。

2024-01-29 15:45:09 1137

原创 如何在 Ubuntu 中安装 Microsoft Edge 浏览器

微软终于聪明了一回,也学会了「打不过就加入」。Microsoft Edge 浏览器的 Linux 稳定版已经于 2020 年 10 月 23 日发布,并提供给使用。除了官方 Edge APT 源以外,还提供了.deb和.rpm格式的安装包。Microsoft Edge 基于 Chromium 开源浏览器引擎开发,任何现代或基于 Chromium 浏览器工作的网站、Web 应用程序或 Web 服务都可以在 Microsoft Edge 中使用。与其他流行的网页浏览器,如。

2024-01-29 15:36:57 8390

转载 PaddleHub文档 linux_quickstart.md

pwd # 查看当前目录是否为style_transfer,若不是则输入:cd ~/style_transfer。该命令会创建1个名为paddle_env、python版本为3.8的可执行环境,根据网络状态,需要花费一段时间。# 若安装时自定义了安装位置,则将~/anaconda3/bin改为自定义的安装目录下的bin文件夹。# 若您要下载其他版本,需要将最后1个/后的文件名改成您希望下载的版本。# 在命令行输入以下命令,创建名为paddle_env的环境。

2024-01-29 15:17:27 207

原创 Anaconda 镜像清华大学开源软件镜像站

Anaconda 是一个用于科学计算的 Python 发行版,支持 Linux, Mac, Windows, 包含了众多流行的科学计算、数据分析的 Python 包。Miniconda 是一个 Anaconda 的轻量级替代,默认只包含了 python 和 conda,但是可以通过 pip 和 conda 来安装所需要的包。文件,并提交pull request,我们会综合考虑多方因素来酌情增减。查看)的镜像,各系统都可以通过修改用户目录下的。清除索引缓存,保证用的是镜像站提供的索引。生成该文件之后再修改。

2024-01-26 19:52:24 781

转载 ALOHA论文翻译:Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware

精细操纵任务,如穿线束扎带或插入电池,对于机器人而言常常具有挑战性,因为它们需要精确性、对接触力的仔细协调以及闭环视觉反馈。执行这些任务通常需要高端机器人、准确的传感器或精细的校准,这可能昂贵且难以设置。学习是否能让低成本和不精确的硬件执行这些精细操纵任务?我们提出了一个低成本系统,直接从真实演示中进行端到端模仿学习,这些演示是使用定制的远程操作界面收集的。然而,模仿学习在高精度领域中也面临着挑战:策略中的错误可能随时间而累积,人类演示可能是非静态的。

2024-01-26 17:10:54 281

原创 Ubuntu 下进行系统备份与迁移

经常一个项目做到一半,结果系统崩溃了,每次都得重装系统,因此,就在想怎么才能够直接在ubuntu系统备份现有的系统呢?找了很多教程,发现都需要安装软件,这些方法都比较复杂,后来终于找到一种简单的方法,记录一下。5、在ubuntu烧录打包好的镜像,先准备一个空硬盘或者 sd卡。3、将正在使用的系统备份到指定目录(此处说明一下,我系统文件在。5.3 查看进度,等待烧录完成。5.2 将镜像烧录到该硬盘中。5.1 查看空盘的盘符。

2024-01-26 14:50:33 915

原创 Ubuntu20.04配置grub ,不必每次都输入 nomodeset

【代码】Ubuntu20.04。

2024-01-26 12:08:17 1717

转载 写给工程师的 Ubuntu 20.04 最佳配置指南

最近 Ubuntu 发布了 20.04 LTS 版本,我也在第一时间安装体验。由于各种 Linux 发行版本并不像 MacOS、Windows 一样开箱即用,因此需要做很多配置。因此我希望整理一份最佳配置指南,除了记录需要做什么,还会说明背后的原理和技术背景。一方面方便自己今后查阅,另一方面也想将这份指南分享给大家,并和大家一起逐步完善它。

2024-01-26 10:21:42 1769 1

转载 nvidia-smi报错:NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver 原因及避坑解决方案

这是由于重启服务器,linux内核升级导致的,由于linux内核升级,之前的Nvidia驱动就不匹配连接了,但是此时Nvidia驱动还在,可以通过命令。如果失败了,别急,接着往下看>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>如果安装失败了,请跟者本文走>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>此时,我们需要把新安装的gcc版本的优先级调到最高,否则系统还是会调用以前版本的gcc,这样还是会导致命令。

2024-01-26 09:55:17 20948 13

原创 Ubuntu20.0.4下设置frpc开机自启动

目录一、下载frp二、解压三、服务端部署1.配置2.运行三、客户端部署1、配置2、后台运行四、开机启动1、拷贝frpc.service2、修改配置3、启用服务五、ubuntu20.04使用 rc-local.service设置开机启动1、建立开机服务添加 [Install] 段2、授权rc-local.service3、然后设置该 rc-local.service 服务开机启动:4、创建 /etc/rc.local。

2024-01-25 19:11:47 2617

原创 在ubuntu20.04 安装nvidia驱动 (亲测有效,这是方法二)

在绝望之中只能继续在网上找,好在天不绝我,经过查资料,才知道设的那个密码干啥用以及那个蓝色界面是干啥的,其实前面重装的步骤没问题的,只不过装完重启的时候需要进入那个蓝色界面输入密码,才能加载nvidia的驱动,至于咋进那个界面,我发现只要你新装一个nvidia驱动以后重启就会出现那个界面,就是说你在附加驱动那里你换个nvidia驱动装完重启就能出现那个蓝色的perform mok management界面。然后你再把之前的nvidia卸载干净重装,就可以成功在安装上nvidia驱动了。

2024-01-25 17:23:56 1473

转载 RTSP协议探秘:从原理到C++实践,解锁实时流媒体传输之道

RTP(Real-time Transport Protocol,实时传输协议)是一个用于实时音频和视频数据传输的网络协议。它在互联网上广泛应用于流媒体、VoIP(Voice over IP)等多媒体通信领域。RTP协议通过UDP/IP协议提供端到端的实时传输服务,支持实时多媒体数据的同步和恢复。时间戳:每个RTP数据包包含一个时间戳,用于表示数据包中的媒体数据的采样时刻。接收端可以使用这个时间戳来实现音视频同步、延时控制和抖动缓冲。序列号:RTP为每个发送的数据包分配一个递增的序列号。

2024-01-25 14:00:17 760 1

原创 Ubuntu22.04安装4090显卡驱动

2、下载系统所需要的版本的NV显卡驱动,本次由于使用CUDA12.1,故选用的驱动版本为NVIDIA-Linux-x86_64-530.41.03.run。9、注意事项:询问是否需要安装32位版本的,选择NO,sign the kernel module选择YES。11、重启结束后,终端输入nvidia-smi,出现详细的显卡信息的时候,表示驱动已经安装成功。3、卸载NV驱动(只是保险起见,并不是一定会卸载,因为压根没安装过)1、安装完Ubuntu系统,打完所有补丁后再进行后续操作。

2024-01-25 12:19:35 2299

原创 要在 Ubuntu 上开启 SSH(Secure Shell)服务器

如果需要修改 SSH 的配置文件,可以编辑 /etc/ssh/sshd_config 文件。比如,可以更改 SSH 登录时所使用的端口、限制登录 IP 地址或者设定密码身份验证等。如果使用了 UFW (Uncomplicated Firewall),则可以通过以下命令允许 SSH 流量:sudo ufw allow ssh。重新加载 SSH 配置文件,使得修改生效:sudo service ssh reload。若要关闭 SSH 服务器,可以使用 sudo service ssh stop 命令。

2024-01-25 11:39:02 637

原创 【血泪】dell_smm_hwmon: unable to get SMM Dell signature-黑屏无法进入Ubuntu系统 - 问题解决

重启电脑,进入系统的时候,进入乌班图高级选项,选择(recovery mode)进入,然后在选择界面选择,root(倒数第二个还是第三个选项),总之就是进入命令行界面。添加之后,重启就进不去了。一直显示dell_smm_hwmon: unable to get SMM Dell signature。昨天下午装了Ubuntu20.04系统,晚上装显卡驱动的时候,重启一下,直接黑屏了。如下图,一直卡着进不去。于是反思,想起来每一次都是执行到:禁用nouveau 的这一步,之后就不能启动了。

2024-01-24 20:25:21 739

转载 dell_smm_hwmon: unable to get SMM Dell signature-黑屏无法进入Ubuntu系统

3.还可能与系统管理模式(SMM)有关,SMM是一种特殊用途的操作模式,用于处理系统范围的功能,如电源管理、系统硬件控制或专有的OEM设计代码。本人是Ubuntu20.04版本,于是通过Shift+Esc进入Ubuntu高级选项,选择(recovery mode)进入,直到进入命令行模式。(其他的系统可通过长按F2/F12/Shift等方法进入Ubuntu高级选项,总之最后能进入到命令行模式即可)2.-------------也可能与BIOS控制的温度传感器有关。证明系统并无问题,大概率是驱动问题。

2024-01-24 19:47:28 549

原创 安装Ubuntu系统详细教程

如果是做系统源码开发的话,买一块内存大于 512G的SSD,如果经济条件好的话,容量越大越好, 一定要在正规官网渠道购买,有些二手固态硬盘容量显示没问题,但是实际存储容量与实际不符合,会导致你在使用的过程中会遇到很多问题,简直会让你怀疑人生。如果你的Ubuntu系统是用来开发的话,尽量少装一些娱乐,影音,视频,通讯等软件,尽量用 Ubuntu系统自带的,中文软件安装越多,系统崩的可能性越大,由于Ubuntu系统安装在整块磁盘上面,系统崩的话,只能重装就会把你的数据全部清除掉了,损失就大了。

2024-01-24 19:07:50 1061

原创 ​img.shape[2 : ]​ img.shape[0]、[1]、[2]到底代表什么

img.shape[ : 3] 则表示取彩色图片的长、宽、通道。img.shape[0]:图像的垂直尺寸(高度)img.shape[1]:图像的水平尺寸(宽度)在矩阵中,[0]就表示行数,[1]则表示列数。[ : 2] 表示取彩色图片的长、宽。img.shape[2]:图像的通道数。

2024-01-23 19:57:48 942

原创 通过MobaXterm实现串口通信与SSH通信

在文章开头,我们讲过通过SSH连接到Ubuntu虚拟机,SSH连接设备的原理是一样的,即打开SSH服务,知道设备IP,账号(用户名)和密码,可以通过SSH进行连接。对于单片机,我们要通过SSH进行访问的话,就需先在机器的系统上,安装SSH功能并打开,这是实现通信的前提。如果sudo apt-get install ssh无法安装,则可以使用sudo apt-get installopenssh-client(这一步可以忽略,因为一般Ubuntu默认安装,我们所做的这一步,可以算作是更新一下SSH服务)

2024-01-23 15:48:05 3498

原创 Linux换行符LF(0x0A)的详细解析

Linux系统是用“\n”(LF)来表示文件结尾的,在Linux下读取到“\n”(LF)就表示这行已经结束了。与之不同的是在Windows系统中,一个文本文件的换行符为“\r\n”(CR+LF),而在Mac系统中,一个文本文件的换行符为“\r”(CR)。

2024-01-23 11:45:18 1588

转载 AI:你总要高清视频,它来了

这个框架基于流引导的动态滤波(Flow-Guided Dynamic Filtering, FGDF)和迭代特征细化的多重注意力机制(Iterative Feature Refinement with Multi-Attention, FRMA),旨在实现从小到大的运动表示学习,并具有良好的联合恢复性能(见图 1)。不过,这个过程并不简单。此外,新提出的多注意力机制,包括以中心为导向的注意力和退化感知注意力,使得 FMA-Net 能够专注于目标帧,并以全局适应的方式使用退化核进行视频超分辨率和去模糊。

2024-01-23 11:16:40 48

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除