自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

junjian Li

加油!

  • 博客(177)
  • 资源 (4)
  • 收藏
  • 关注

原创 Frp内网穿透

搞一台具有公网ip的阿里云服务器,特价的时候挺便宜,2核心2GB才99一年。

2024-06-24 20:38:00 922

原创 Apex安装

apex

2024-05-23 10:33:01 142

原创 rearrange(h, ‘b (ws w) c -> b w ws c‘, ws=4)和rearrange(h, ‘b (w ws) c -> b w ws c‘, ws=4)的区别

rearrange(h, 'b (ws w) c -> b w ws c', ws=4)和rearrange(h, 'b (w ws) c -> b w ws c', ws=4)的区别

2024-04-22 20:35:41 181 1

原创 Driver install fails with the error [An error occurred while performing the step: “building kernel m

这是 Ubuntu 内核的问题。ubuntu内核团队决定使用gcc-12进行内核编译,而22.04系统编译器是gcc-11。请从 ubuntu 存储库安装 gcc-12,以便能够再次编译 nvidia 模块。

2024-03-14 20:13:49 398

原创 openslide安装以及常见命令

openslide安装以及常见命令

2023-10-29 15:42:05 961

原创 不同的数据增强,对于病理图像的效果

数据来源:https://2021.midl.io/proceedings/faryna21.pdf。

2023-08-22 15:52:27 212

原创 谷歌禁止的脏话和热门脏话的完整列表

脏话和脏话列表,谷歌黑名单单词。包括;咒骂词、侮辱性词、攻击性词、脏词、粗俗词等等。

2023-08-21 09:10:43 602

原创 webDAV + aliyundriver + 阿里云盘 实现免费的云存储云同步

只需要简单的配置一下,就可以让阿里云盘变身为webdav协议的文件服务器。基于此,你可以把阿里云盘挂载为Windows、Linux、Mac系统的磁盘,可以通过NAS系统做文件管理或文件同步;

2023-07-23 16:26:28 6886

原创 爬虫的xpath

‘return document.body.scrollHeight’‘window.scrollTo(0,-200)’‘window.scrollTo(0,document.body.scrollHeight)’‘return document.body.scrollHeight’url = ‘https://www.heycan.com/material#paster’‘xpath’, ‘//*[@id=“root”]/section/main/section/div/div[2]/div[1]/div

2023-07-08 10:01:53 589

原创 WSI分类

双流图像表征网络(Dual-stream Network)

2023-06-20 17:49:29 972

原创 pytorch 前向传播与反向传播代码+ fp16

pytorch 前向传播与反向传播代码 + fp16

2023-05-18 08:54:29 614

原创 免root安装tmux(一键式脚本)

【代码】免root安装tmux(一键式脚本)

2023-04-29 17:31:04 206

原创 python -m中m参数的解释

python -m是将库中的python模块用作脚本去运行。

2023-04-13 15:33:55 490

原创 音频特征提取

它表示音频信号频谱的复杂程度或不确定性,可以用于识别音频中的不同声音,例如不同乐器的音色。谱熵特征通常与其他特征(如MFCC、零交叉率、能量、谱滚降点和谱通量)结合使用,以提高音频处理任务的性能。色度特征通常与其他特征(如MFCC、零交叉率、能量、谱滚降点、谱通量和谱熵)结合使用,以提高音频处理任务的性能。它表示音频信号频谱的变化程度,可以用于检测音频中的事件,例如音符的开始和结束。它表示音频信号的振幅大小,可以用于识别信号中的不同声音,例如辅音和元音,以及不同乐器的音色。

2023-03-17 16:47:31 4495 1

原创 python中的多进程和多线程

进程是程序在计算机上的一次执行活动,就是正在运行的应用程序,通常成为进程。每一个进程有自己独立的地址空间(内存空间)。线程是一个轻量级的子进程,是最小的处理单元;线程是进程的子集,一个进程可以由多个线程组成;多线程是指有多个线程存在于进程中,这些线程之间共享进程的资源。,一个线程只能属于一个进程,一个进程可以拥有多个线程;

2023-03-16 19:55:15 1479

原创 对 /dev/shm 认识

因此在linux下,就不需要大费周折去建 ramdisk,直接使用/dev/shm/就可达到很好的优化效果。/dev /shm/需要注意的一个是容量问题,在linux下,它。,使用df -h命令可以看到。但它并不会真正的占用这块内存,如果/dev/shm/下没有任何文件,它占用的内存实际上就是0字节;是linux下一个非常有用的目录,因为。

2023-03-16 10:13:18 124

原创 Linux中使用setproctitle修改进程的名称

setprotitle来修改进程的名字

2023-03-02 19:16:28 629 2

原创 tmux 学习与常用命令

tmux

2023-02-24 16:56:18 195

原创 【无标题】

【代码】【无标题】

2023-02-23 23:52:59 82

原创 Linux wget爬虫命令

查看网站URL是否正常最常见的方式莫过于使用wget和curl工具来活动网站的URL信息;–q, --quit 安静的访问,禁止输出,类似于 -o 、dev/null。–o, --output-file=FILE,记录输出到文件中。–spider 模拟爬虫的行为去访问网站,但是不会下载网站。实时监控的方式:(利用放回值确定网站是否正常)=> 输出 0 表示上个命令执行正常。–T, 网站访问超时的时间。–t,网站异常时重试的次数。

2023-02-21 14:59:01 661

原创 Flask中第一个参数__name__的含义

如果 test.py 模块位于一个名为 my_package 的 Python 包中,那么 __name__的值就是 my_package.test。我们在使用Flask框架时,创建一个app,需要用到Flask(__name__)的语句;中名为 test.py 的模块中,__name__的值为 test。

2023-02-20 13:49:17 267

原创 python日志logger

【代码】python日志logger。

2023-02-20 10:24:19 182

原创 shell中的#!/bin/bash

是一个特殊的表示符,其后,跟着解释此脚本的shell路径。是指此脚本使用/bin/bash来解释执行。

2023-02-19 21:32:34 843

原创 python定义类的时候继承object类

区别在于python2和python3,python3继承不继承object类都没有区别,但是python2继承object类的话,可以获得更多的魔术方法(静态方法,类方法的构造,类属性的快速访问,定制类实例的实现方法)。

2023-02-17 09:15:35 295

原创 Python中类对象自带的__str__函数

_str__是Python中类对象自带的一个函数,正常情况下,我们实例化对象后,print对象,输出的是这个对象的地址.而通过自定义__str__()函数,可以帮我们打印对象中的内容。

2023-02-16 15:42:26 448

原创 @classmethod

@classmethod

2022-12-07 17:30:46 873

原创 常见shell命令

shell 命令shell 命令含义$0当前脚本的文件名$n传递给脚本的参数$#传递给脚本的参数的个数$*传递给脚本的所有参数$@传递给脚本的所有参数$?上个命令的退出状态,或者函数的返回值$$当前shell的进程ID-n字符串长度是否不为0,若不为0则为True-d目录是否存在,若存在则为True-h是否是软链接,若是,则为True-ltlow than 小于-gegreater equals

2022-12-03 16:48:07 1148

原创 【PyTorch】torch.mean(), dim=0, dim=1

【PyTorch】torch.mean(), dim=0, dim=1

2022-09-09 16:45:26 1364

原创 nginx配置参数解释

Nginx是一款轻量级的HTTP服务器,采用事件驱动的异步非阻塞处理方式框架,这让其具有极好的IO性能,时常用于服务端的反向代理和负载均衡。nginx文件是Nginx的总配置文件,在我们搭建服务器时经常调整的文件。使用如下命令打开nginx.conf文件。......

2022-08-30 19:11:23 11717

原创 python格式化日期时间自动补0

python格式化日期时间自动补0

2022-08-30 16:34:07 1417

原创 Git的安装使用

git配置与常用命令

2022-06-25 16:43:21 86

原创 linux 后台运行并输出log到指定文件

linux 后台运行并输出log到指定文件nohup python -u run_pretrain_nezha.py >run_pretrain_nezha.txt 2>&1 &

2022-05-10 11:11:18 1503

原创 将Jupyter Notebook代码转换为Python脚本

jupyter nbconvert --to script my_notebook.ipynb

2022-01-29 19:16:22 1813

转载 小布助手nlp比赛

1.赛题背景小布助手是OPPO公司为欧加集团三品牌手机和IoT设备自研的语音助手,为用户提供了有趣、贴心、便捷的对话式服务。意图识别是对话系统中的一个核心任务,而对话短文本语义匹配是意图识别的主流算法方案之一。本赛题要求参赛队伍根据脱敏后的短文本query-pair,预测它们是否属于同一语义,提交的结果按照指定的评价指标使用在线评测数据进行评测和排名,得分最优者获胜。2.赛题描述及数据说明训练数据训练数据包含输入query-pair,以及对应的真值。初赛训练样本10万,复赛训练样本30万,这份数据主

2022-01-17 21:42:08 200

原创 Nezha预训练备份

build_model_and_tokenizer(args)def build_model_and_tokenizer(args): tokenizer = BertTokenizer.from_pretrained(args.vocab_path) model_config = NeZhaConfig.from_pretrained(args.pretrain_model_path) model = NeZhaForMaskedLM.from_pretrained(pret.

2022-01-15 00:37:30 801

原创 Pytorch里面的DataLoader的collate_fn参数

DataLoader的collate_fn参数,实现自定义的batch输出。DataLoader完整的参数表如下:class torch.utils.data.DataLoader( dataset, batch_size=1, shuffle=False, sampler=None, batch_sampler=None, num_workers=0, collate_fn=<function default_collate>,

2022-01-13 19:09:23 1295

原创 文本分类,可能有用的tricks

一、稳定有收益的,祖传老方子RNN based model 包括LSTM和GRU,使用双向结构embedding之后使用dropoutensemble集成尽可能找到还原语义的pretrained embedding,实际情况是oov千奇百怪,拼写检查,基本上是100倍的努力,一点点收益,或者拆词,拆字能一定程度上缓解(比如说你要训练一个某个领域(量化投资)的人短信文本分类,有条件下尽量自己拿相近的行业比较大的语聊训练一个词向量,实际上线的遇见比如investvanguard(OOV)【假设一个投资

2022-01-12 23:21:25 297

转载 AEDA:文本分类数据增强

AEDA:AnEasier Data Augmentation Technique for Text Classification论文地址:https://arxiv.org/pdf/2108.13230.pdf代码地址:https://github.com/akkarimi/aeda_nlp为了让模型由更好的泛化能力,一般需要更多的更加全面的数据集,但是数据的收集和标注是很费事费力的,所以这个时候数据增强技术就很重要。在NLP领域,EDA(Easy Data Augmentation Tech

2022-01-09 17:01:26 854

原创 bert模型的输出

bert模型的输出可以包括四个:last_hidden_state:torch.FloatTensor类型的,最后一个隐藏层的序列的输出。大小是(batch_size, sequence_length, hidden_size) sequence_length是我们截取的句子的长度,hidden_size是768.pooler_output: torch.FloatTensor类型的,[CLS]的这个token的输出,输出的大小是(batch_size, hidden_size)hidden_sta

2021-12-30 11:24:56 9985

原创 pandas 速查

判断pandas的某一列的元素是否在已知的list A里面,保存在A中的那些行. train_o = train[train['compare'].isin(list_a)]如果train[‘compare’]这个元素在list_a中,那么就保存,不在就不保存

2021-12-19 12:52:46 750

Microsoft Visual C++ 14.0-15.zip

Microsoft Visual C++ 14.0-15,Microsoft Visual C++ 14.0-15,Microsoft Visual C++ 14.0-15,Microsoft Visual C++ 14.0-15

2020-06-28

cuDNN v7.0.5-linux绝对可以用的

亲测可用,在官网下载得太慢,而且还要注册,所以特地上传一下。安装cudnn可以在我的博客里看。

2019-08-10

基于稳态模式的转差频率控制的交.zip

基于稳态模式的转差频率控制的交流调速系统的仿真与设计,仿真模型matlab版本是2012a的,有些版本会报错。里面包含simulink仿真文件和仿真图

2019-05-26

史上最全的菜菜的sklearn学习[教程很详细].rar

史上最全的菜菜的sklearn学习[教程很详细

2019-05-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除