- 博客(68)
- 收藏
- 关注
原创 使用bypy丝滑传递百度网盘-服务器文件
还在为百度网盘的数据集难以给服务器做同步而痛苦吗,bypy来拯救你了!bypy是一个强大而灵活的百度网盘命令行客户端工具。它是基于Python开发的开源项目,为用户提供了一种通过命令行界面与百度网盘进行交互的方式。使用bypy,可以轻松地执行上传、下载、同步、列出目录内容等操作,这个工具特别适合需要自动化网盘操作或偏好命令行界面的用户。bypy支持增量同步,能有效处理大文件,并提供了丰富的命令选项,我觉得是一个特别优雅的小工具,推荐给大家。
2024-07-09 11:45:56
400
原创 软连接迁移 Docker 的默认安装(存储)目录
经常我们会拿到一些别人装好的服务器,需要在这些系统上启动我们的docker服务。但是这些“专业人员”呢,有时候就会有非常不专业的操作,比如他把根目录/只划分50GB,/home却有51TB。这个时候就会导致我们的服务器还有很多空间的时候,docker却因为磁盘空间满,服务跑不起来了。因为docker一般根目录是在/var/lib/docker这个目录下。遇到这种情况我们就需要做数据迁移了,此外还有改docker的配置文件的方式。本文只介绍最轻装的基于软连接的数据迁移方式。先记下这个目录,后面会用到,因
2024-07-03 11:09:28
437
原创 【论文精读】Self-Supervised Learning for Time Series Analysis: Taxonomy, Progress, and Prospects【2】
而且关于。
2024-07-02 22:19:37
689
原创 【论文精读】Self-Supervised Learning for Time Series Analysis: Taxonomy, Progress, and Prospects【1】
引言和背景研究动机研究方法和目的主要内容和贡献结论和展望我们从这个角度去看这个摘要自监督学习(SSL)最近在各种时间序列任务上取得了令人印象深刻的性能。SSL最显著的优势是它减少了对标记数据的依赖。基于预训练和微调策略,即使只有少量标记数据也能实现高性能。与计算机视觉和自然语言处理领域已发表的许多自监督学习综述相比,时间序列SSL的全面综述仍然缺失。为填补这一空白,我们在本文中回顾了时间序列数据当前最先进的SSL方法。
2024-07-01 20:35:07
671
原创 encoding Token和embedding 傻傻分不清楚?
encoding” 是一个在计算机科学和人工智能领域广泛使用的术语,它可以指代多种不同的过程和方法。。当然你或许会说字符集(Unicode)更理解这种概念,编码更强调这种动态的过程。而字符集是静态的。
2024-06-11 22:06:18
858
原创 报错:partially initialized module ‘charset_normalizer‘ has no attribute ‘md__mypyc‘ (most likely due t
partially initialized module 'charset_normalizer' has no attribute 'md__mypyc' (most likely due to a circular import)
2024-06-11 22:01:58
217
原创 python安装openai【使用阿里通义千问模型调用】
网上很多帖子说使用openai,python版本要低于3.9,已经4202年了,时代变了,现在python 3.11能很好地使用oepnai。
2024-06-04 17:34:52
677
原创 用 OpenCV 实现图像中水平线检测与校正
图像加载与预处理:加载图像,转换为灰度图,然后使用 Canny 算法检测边缘。线条检测:应用霍夫变换来识别图像中的线条。水平线条筛选:过滤出接近水平的线条。线条可视化:在图像上绘制检测到的水平线。计算需要的旋转角度:计算线条的加权平均角度,以确定图像应旋转的角度。图像旋转校正:根据计算出的角度旋转图像,以校正线条至水平。
2024-06-03 20:34:48
1086
2
原创 x86_64和AMD64和ARM64?傻傻分不清楚?
First of first,你要知道指令集(instruction set)是一个什么东西,指令集是计算机硬件和软件之间的桥梁,它定义了处理器可以执行的基本操作,操作系统和应用软件必须根据指令集来编写,才能在特定的处理器上运行。
2024-05-21 17:37:52
16695
2
原创 【LeetCode】修炼之路-0003-longest-substring-without-repeating-characters(无重复字符的最长子串)【python】【中等】
leetcode 0003 最长无重复字串 python题解
2024-04-17 22:49:17
1016
1
原创 【LeetCode】修炼之路-0002-Add Two Numbers(两数相加)【python】【中等】
You are given two non-empty linked lists representing two non-negative integers. The digits are stored in reverse order, and each of their nodes contains a single digit. Add the two numbers and return the sum as a linked list.You may assume the two numbers
2024-04-09 17:46:14
632
原创 【Python基础小知识】Python如何实现单链表
在 Python 中,我们通常不直接使用指针,而是使用对象引用。Python 作为一种高级语言,隐藏了许多底层的内存管理细节,包括指针的操作。然而,理解指针的概念对于理解 Python 中的某些数据结构(如链表)仍然很有帮助。
2024-04-03 17:14:37
337
原创 【Python基础知识点】Python的浅拷贝和深拷贝
在大多数情况下,如果你的对象只包含原始数据类型或只有一层嵌套,你可以使用浅拷贝。但如果你的对象包含多层嵌套或可变对象,为了确保完全的独立性,你应该使用深拷贝。
2024-04-02 17:21:49
404
原创 【LeetCode】修炼之路-0001-Two Sum(两数之和)【python】【简单】
计算机科学作为一门实践性极强的学科,代码能力的培养尤为重要。当前网络上有非常多优秀的前辈分享了LeetCode的最佳算法题解,这对于我们这些初学者来说提供了莫大的帮助,但对于我这种缺乏编程直觉的学习者而言,这往往难以消化吸收。(为什么别人就能想出这么优雅,高级的实现!我就只会暴力呢)我浅薄地认为,只有理解算法设计的思路,才能真正掌握编程技巧。鉴于此,本系列试图呈现另一种LeetCode修炼之路——从基本原理出发,一步步拓展思路,逐级深化难度。
2023-12-29 19:56:56
1075
原创 Linux Namespace:轻量级虚拟化技术简介
Linux Namespace 是内核的一个特性,它可以隔离一部分系统资源,使得一个进程及其子进程在 Namespace 内部有一个独立的全局视图,看到的资源与外部系统的全局资源是隔离的。这使得在 Namespace 内的进程能够运行在一个被隔离和安全的环境中,就像在一个独立的系统中一样。Linux Namespace 是一种强大而灵活的轻量级虚拟化技术,它使得我们可以在同一台机器上运行多个隔离的进程或应用程序,而无需额外的虚拟化开销。
2023-10-12 21:19:22
548
原创 什么是H2D和D2H的内存拷贝问题
H2D: Host to Device 的缩写,表示将内存从CPU(Host)拷贝到GPU device(设备)上。D2H: Device to Host 的缩写,表示将内存从GPU device拷贝回CPU上。但CPU和GPU存在不同的内存空间,内存拷贝需要通过PCI-E总线,这是一个非常慢的操作。在GPU计算中,数据需要在CPU和GPU之间传输,这就涉及到H2D和D2H的内存拷贝。频繁的H2D和D2H拷贝会成为GPU应用的瓶颈,因此需要尽量减少不必要的内存拷贝。批量处理数据,减少拷贝次数。
2023-09-23 16:15:28
1258
原创 Docker CMD指令如何覆写
所以Dockerfile中的CMD指令只是提供一个默认的命令,在之后各种使用场景下都是可以被覆盖的。我们可以通过CMD提供一个应用的默认启动命令,但在具体运行时可以很灵活地修改和覆盖它。在运行中的容器内可以直接执行其他命令,会覆盖CMD指令。在Dockerfile里,CMD指令是可以被覆盖的。
2023-09-22 14:14:55
1233
原创 开源许可证概述:GNU, BSD, Apache, MPL, 和 MIT
开源许可证是开源软件分发的基础。它们定义了使用者如何使用,修改,分发开源软件。在这篇文章中,我们将探讨五种常见的开源许可证:GNU通用公共许可证 (GNU GPL),BSD许可证,Apache许可证,Mozilla公共许可证 (MPL) 和麻省理工学院许可证 (MIT)。我们将给出每种许可证的一些代表性的开源项目,并比较它们的主要特点和区别。
2023-09-06 15:22:11
1015
原创 Python的re正则表达式库基本用法
如果你需要从字符串的开头开始匹配模式,使用re.match()。如果你需要搜索整个字符串并找到第一个匹配项,使用。如果你希望找到字符串中所有匹配项,使用或。如果你需要替换字符串中的匹配项,使用re.sub()。如果你需要根据模式将字符串分割为子字符串,使用re.split()。需要注意的是,re.match() 和 re.search() 方法在匹配成功时返回的是 re.Match 对象,它提供了一系列方法(如 group())用于提取匹配的内容。
2023-08-25 13:05:19
143
原创 如何在服务器上用kaggle下载数据集
使用scp指令,rz指令,ftp等一万种方式将将kaggle.json文件复制到~/.kaggle目录下,正常执行。进入你的浏览器下载页,可以看到有了一个kaggle.json。点击 Copy API command ,即复制了下载指令。5.这个时候执行kaggle,可以看到已经有指令了。将这个地址写入~/.bash_file。2.编辑~/.bash_profile。4.更新~/.bash_profile。点击右上角头像,选择setting。1.查看自己的kaggle执行路径。可以看到,速度很快~
2023-08-22 23:04:50
1441
原创 如何写一个简单的dockerfile
Dockerfile 是一种文本文档,它包含了一组用户可以调用以创建镜像的指令。用户可以使用 docker build 命令,根据 Dockerfile 中定义的步骤,自动构建出一个新的 Docker 镜像。以下是一些常用的 Dockerfile 指令:FROM:设置基础镜像,必须为第一个非注释指令。ADD:将文件从 Docker 主机复制到 Docker 镜像。这个命令也可以接受一个 URL 作为参数。COPY:类似于 ADD,但只关注复制本地文件,而不会提取和解压等操作。
2023-08-20 23:29:42
404
原创 anaconda 基本指令
例如我们创建一个名称为img2word,python版本为3.9的环境createpython=3.9选择(y/n)的页面选择y,回车,然后出现如下信息,显示安装完毕。
2023-08-10 13:54:07
504
原创 【K8s】k8s配置存储卷PersistentVolumeClaim里的readwriteonce是什么意思
在选择访问模式时,你需要考虑你的应用的需求和你的存储类型的支持情况。例如,如果你的应用需要在多个节点上运行,并且需要同时访问同一个卷,那么你可能需要一个支持ReadWriteMany的存储类型。但是,如果你的应用只在一个节点上运行,那么ReadWriteOnce就足够了。在下面给出的例子中,ReadWriteOnce意味着这个PersistentVolumeClaim只能被一个Pod以读写模式挂载,这对于大多数数据库应用来说是合适的,因为数据库通常不支持在多个节点上共享存储。
2023-07-28 14:21:11
2594
原创 【论文分享】InternVideo: General Video Foundation Models via Generative and Discriminative Learning
最近,基础模型在计算机视觉领域的各种下游任务上表现出色。然而,大多数现有的视觉基础模型仅关注图像层次的预训练和适应(adaption),这对于动态且复杂的视频层次理解任务来说是有限的。为了填补这一空白,我们通过利用生成式和判别式自监督视频学习的优势,提出了通用视频基础模型InternVideo。具体来说,InternVideo高效地探索了遮罩视频建模和视频-语言对比学习作为预训练目标,并以可学习的方式选择性地协调这两个互补框架的视频表示,以提升各种视频应用。
2023-07-25 19:46:30
1740
原创 什么是深度学习的误差分解
误差分解是将深度学习模型的预测误差拆分为多个组成部分,以便更好地理解模型性能。用于训练的和你选择的一起导致了你的模型的效果,导致的预测误差,也主要是由这两个要素构成的。
2023-07-12 17:14:11
796
原创 【报错】eadTimeoutError: HTTPSConnectionPool(host=‘files.pythonhosted.org‘, port=443): Read timed out.
pip install 显示 read timed out
2023-07-06 10:55:55
275
原创 python通过SimpleITK库预览.mha格式图片
file_path = Path(“/Users/mark/ok.mha”) # 改为你的mha图片的路径地址。# 将SimpleITK图像转换为NumPy数组。# 使用SimpleITK库读取MHA文件。
2023-06-14 14:45:59
711
原创 什么是椭圆曲线上的加法
椭圆曲线上的加法不是我们通常意义上的数值加法,而是一种特殊的几何运算。在椭圆曲线密码学中,我们将椭圆曲线上的点进行组合,这种组合遵循特定的规则,称为“
2023-06-14 11:59:08
1543
原创 shell/sh脚本里的$1、$2是什么意思
在 shell 脚本中,$1、$2 等表示传递给脚本的命令行参数。$0 表示脚本本身的名字,$1 表示第一个参数,$2 表示第二个参数,依此类推。:在 shell 脚本中,$* 和 $@ 都表示传递给脚本的所有命令行参数。当你在双引号中使用它们时,它们的行为会有区别。:当你使用 “$*” 时,所有参数将被视为一个单独的参数,用第一个字符(默认为空格)连接在一起。这意味着,如果你有多个带空格的参数,它们将被视为一个整体。:当你使用 “$@” 时,每个参数都将被单独处理,即使它们包含空格。
2023-06-14 11:30:58
8200
原创 Docker宿主机复制(单个文件夹/多个文件/单个文件)到容器
我的JPEGImages里面包含了多张图片,下面的指令将宿主机JPEGImages目录下的所有文件和子目录复制到7a7608e0bf84容器的/home/PaddleSeg/input/目录下。docker cp <宿主机目标路径> <容器ID或名称>:<容器源路径>docker cp <容器ID或名称>:<容器源路径> <宿主机目标路径>使用多行docker cp指令。
2023-06-09 17:13:46
3101
原创 png图像格式转mha
将上述代码保存至png_to_mha.py,下面的代码将读取/input/images下的png图片,转换成mha并输出到/output/images目录。
2023-06-09 10:22:23
159
原创 【Word】【WPS】跨行显示表格标题/表头
在Word中,插入的表格默认情况下,第一行不会被自动识别为标题行。要让Word中的表格跨页正常显示标题行,你可以按照以下步骤进行操作。
2023-05-23 17:44:03
4019
原创 linux常用函数grep参数简介
比如我们安装miniconda3的路径错了,但是修改~/.bashrc文件,却无法生效时,比如我的用户是mark我们可以去我们的用户目录mark下执行检索,看这个配置参数是写在了哪个文件里。是一个强大的文本搜索工具,它使用正则表达式来搜索文本,并打印出匹配的行。只会匹配整个单词为"is"的行,而不会匹配包含"this"或"his"的行。输出文件中匹配到pattern的行数,而不是具体的行。:反转匹配,只输出不匹配pattern的行。:只输出包含匹配的文件名,而不输出匹配的行。:可以指定多个搜索模式。
2023-05-21 22:01:34
453
原创 numpy.random常用随机数生成方法
生成low(包含)到high(不包含)之间的均匀分布的随机数。: 生成均值为loc、标准差为scale的正态分布的随机数。: 生成low(包含)到high(不包含)之间的随机整数。: 生成均值为0、标准差为1的标准正态分布的随机数。: 生成[0, 1)之间的均匀分布的随机数。: 从给定的一维数组中生成随机数。函数的示例,生成的size是。: 生成二项分布的随机数。: 生成泊松分布的随机数。: 生成伽马分布的随机数。: 生成β分布的随机数。
2023-05-12 15:10:49
360
原创 numpy和pandas的轴到底是什么
在 NumPy 中,数组的轴可以被看作是数组的维度。例如,对于二维数组,第一个轴(axis=0)代表行,第二个轴(axis=1)代表列。对于三维数组,第一个轴代表高度、第二个轴代表行、第三个轴代表列,依此类推。在 pandas 中,轴的概念类似。DataFrame 对象有两个轴:行轴(axis=0)和列轴(axis=1)。在 Series 对象中,只有一个轴,即行轴。理解轴的概念对于进行数据操作和计算非常重要。许多函数和方法在执行时都会接受轴参数,用于指定沿着哪个方向进行操作。
2023-05-12 11:31:03
324
原创 torch.sigmoid()、torch.nn.Sigmoid()和torch.nn.functional.sigmoid()三者之间的区别
这是一个直接的函数调用,适用于任何需要计算Sigmoid函数的情况。这个函数接受一个张量作为输入,并返回一个新的张量,其中包含输入张量中每个元素的Sigmoid值。: 这是一个类定义,通常用在定义神经网络模型的类中,作为一个层来使用。这个类创建了一个可调用的对象,当调用这个对象时,会计算输入张量的Sigmoid值。综上所述,如果你在定义一个模型的类,并希望在其中使用Sigmoid激活函数,你应该选择。然而,需要注意的是,这个函数在PyTorch的后续版本中已经被弃用,建议使用。
2023-05-11 20:45:12
1002
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人