- 博客(177)
- 资源 (4)
- 收藏
- 关注
原创 rearrange(h, ‘b (ws w) c -> b w ws c‘, ws=4)和rearrange(h, ‘b (w ws) c -> b w ws c‘, ws=4)的区别
rearrange(h, 'b (ws w) c -> b w ws c', ws=4)和rearrange(h, 'b (w ws) c -> b w ws c', ws=4)的区别
2024-04-22 20:35:41
181
1
原创 Driver install fails with the error [An error occurred while performing the step: “building kernel m
这是 Ubuntu 内核的问题。ubuntu内核团队决定使用gcc-12进行内核编译,而22.04系统编译器是gcc-11。请从 ubuntu 存储库安装 gcc-12,以便能够再次编译 nvidia 模块。
2024-03-14 20:13:49
398
原创 webDAV + aliyundriver + 阿里云盘 实现免费的云存储云同步
只需要简单的配置一下,就可以让阿里云盘变身为webdav协议的文件服务器。基于此,你可以把阿里云盘挂载为Windows、Linux、Mac系统的磁盘,可以通过NAS系统做文件管理或文件同步;
2023-07-23 16:26:28
6886
原创 爬虫的xpath
‘return document.body.scrollHeight’‘window.scrollTo(0,-200)’‘window.scrollTo(0,document.body.scrollHeight)’‘return document.body.scrollHeight’url = ‘https://www.heycan.com/material#paster’‘xpath’, ‘//*[@id=“root”]/section/main/section/div/div[2]/div[1]/div
2023-07-08 10:01:53
589
原创 音频特征提取
它表示音频信号频谱的复杂程度或不确定性,可以用于识别音频中的不同声音,例如不同乐器的音色。谱熵特征通常与其他特征(如MFCC、零交叉率、能量、谱滚降点和谱通量)结合使用,以提高音频处理任务的性能。色度特征通常与其他特征(如MFCC、零交叉率、能量、谱滚降点、谱通量和谱熵)结合使用,以提高音频处理任务的性能。它表示音频信号频谱的变化程度,可以用于检测音频中的事件,例如音符的开始和结束。它表示音频信号的振幅大小,可以用于识别信号中的不同声音,例如辅音和元音,以及不同乐器的音色。
2023-03-17 16:47:31
4495
1
原创 python中的多进程和多线程
进程是程序在计算机上的一次执行活动,就是正在运行的应用程序,通常成为进程。每一个进程有自己独立的地址空间(内存空间)。线程是一个轻量级的子进程,是最小的处理单元;线程是进程的子集,一个进程可以由多个线程组成;多线程是指有多个线程存在于进程中,这些线程之间共享进程的资源。,一个线程只能属于一个进程,一个进程可以拥有多个线程;
2023-03-16 19:55:15
1479
原创 对 /dev/shm 认识
因此在linux下,就不需要大费周折去建 ramdisk,直接使用/dev/shm/就可达到很好的优化效果。/dev /shm/需要注意的一个是容量问题,在linux下,它。,使用df -h命令可以看到。但它并不会真正的占用这块内存,如果/dev/shm/下没有任何文件,它占用的内存实际上就是0字节;是linux下一个非常有用的目录,因为。
2023-03-16 10:13:18
124
原创 Linux wget爬虫命令
查看网站URL是否正常最常见的方式莫过于使用wget和curl工具来活动网站的URL信息;–q, --quit 安静的访问,禁止输出,类似于 -o 、dev/null。–o, --output-file=FILE,记录输出到文件中。–spider 模拟爬虫的行为去访问网站,但是不会下载网站。实时监控的方式:(利用放回值确定网站是否正常)=> 输出 0 表示上个命令执行正常。–T, 网站访问超时的时间。–t,网站异常时重试的次数。
2023-02-21 14:59:01
661
原创 Flask中第一个参数__name__的含义
如果 test.py 模块位于一个名为 my_package 的 Python 包中,那么 __name__的值就是 my_package.test。我们在使用Flask框架时,创建一个app,需要用到Flask(__name__)的语句;中名为 test.py 的模块中,__name__的值为 test。
2023-02-20 13:49:17
267
原创 python定义类的时候继承object类
区别在于python2和python3,python3继承不继承object类都没有区别,但是python2继承object类的话,可以获得更多的魔术方法(静态方法,类方法的构造,类属性的快速访问,定制类实例的实现方法)。
2023-02-17 09:15:35
295
原创 Python中类对象自带的__str__函数
_str__是Python中类对象自带的一个函数,正常情况下,我们实例化对象后,print对象,输出的是这个对象的地址.而通过自定义__str__()函数,可以帮我们打印对象中的内容。
2023-02-16 15:42:26
448
原创 常见shell命令
shell 命令shell 命令含义$0当前脚本的文件名$n传递给脚本的参数$#传递给脚本的参数的个数$*传递给脚本的所有参数$@传递给脚本的所有参数$?上个命令的退出状态,或者函数的返回值$$当前shell的进程ID-n字符串长度是否不为0,若不为0则为True-d目录是否存在,若存在则为True-h是否是软链接,若是,则为True-ltlow than 小于-gegreater equals
2022-12-03 16:48:07
1148
原创 nginx配置参数解释
Nginx是一款轻量级的HTTP服务器,采用事件驱动的异步非阻塞处理方式框架,这让其具有极好的IO性能,时常用于服务端的反向代理和负载均衡。nginx文件是Nginx的总配置文件,在我们搭建服务器时经常调整的文件。使用如下命令打开nginx.conf文件。......
2022-08-30 19:11:23
11717
原创 linux 后台运行并输出log到指定文件
linux 后台运行并输出log到指定文件nohup python -u run_pretrain_nezha.py >run_pretrain_nezha.txt 2>&1 &
2022-05-10 11:11:18
1503
原创 将Jupyter Notebook代码转换为Python脚本
jupyter nbconvert --to script my_notebook.ipynb
2022-01-29 19:16:22
1813
转载 小布助手nlp比赛
1.赛题背景小布助手是OPPO公司为欧加集团三品牌手机和IoT设备自研的语音助手,为用户提供了有趣、贴心、便捷的对话式服务。意图识别是对话系统中的一个核心任务,而对话短文本语义匹配是意图识别的主流算法方案之一。本赛题要求参赛队伍根据脱敏后的短文本query-pair,预测它们是否属于同一语义,提交的结果按照指定的评价指标使用在线评测数据进行评测和排名,得分最优者获胜。2.赛题描述及数据说明训练数据训练数据包含输入query-pair,以及对应的真值。初赛训练样本10万,复赛训练样本30万,这份数据主
2022-01-17 21:42:08
200
原创 Nezha预训练备份
build_model_and_tokenizer(args)def build_model_and_tokenizer(args): tokenizer = BertTokenizer.from_pretrained(args.vocab_path) model_config = NeZhaConfig.from_pretrained(args.pretrain_model_path) model = NeZhaForMaskedLM.from_pretrained(pret.
2022-01-15 00:37:30
801
原创 Pytorch里面的DataLoader的collate_fn参数
DataLoader的collate_fn参数,实现自定义的batch输出。DataLoader完整的参数表如下:class torch.utils.data.DataLoader( dataset, batch_size=1, shuffle=False, sampler=None, batch_sampler=None, num_workers=0, collate_fn=<function default_collate>,
2022-01-13 19:09:23
1295
原创 文本分类,可能有用的tricks
一、稳定有收益的,祖传老方子RNN based model 包括LSTM和GRU,使用双向结构embedding之后使用dropoutensemble集成尽可能找到还原语义的pretrained embedding,实际情况是oov千奇百怪,拼写检查,基本上是100倍的努力,一点点收益,或者拆词,拆字能一定程度上缓解(比如说你要训练一个某个领域(量化投资)的人短信文本分类,有条件下尽量自己拿相近的行业比较大的语聊训练一个词向量,实际上线的遇见比如investvanguard(OOV)【假设一个投资
2022-01-12 23:21:25
297
转载 AEDA:文本分类数据增强
AEDA:AnEasier Data Augmentation Technique for Text Classification论文地址:https://arxiv.org/pdf/2108.13230.pdf代码地址:https://github.com/akkarimi/aeda_nlp为了让模型由更好的泛化能力,一般需要更多的更加全面的数据集,但是数据的收集和标注是很费事费力的,所以这个时候数据增强技术就很重要。在NLP领域,EDA(Easy Data Augmentation Tech
2022-01-09 17:01:26
854
原创 bert模型的输出
bert模型的输出可以包括四个:last_hidden_state:torch.FloatTensor类型的,最后一个隐藏层的序列的输出。大小是(batch_size, sequence_length, hidden_size) sequence_length是我们截取的句子的长度,hidden_size是768.pooler_output: torch.FloatTensor类型的,[CLS]的这个token的输出,输出的大小是(batch_size, hidden_size)hidden_sta
2021-12-30 11:24:56
9985
原创 pandas 速查
判断pandas的某一列的元素是否在已知的list A里面,保存在A中的那些行. train_o = train[train['compare'].isin(list_a)]如果train[‘compare’]这个元素在list_a中,那么就保存,不在就不保存
2021-12-19 12:52:46
750
Microsoft Visual C++ 14.0-15.zip
2020-06-28
基于稳态模式的转差频率控制的交.zip
2019-05-26
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人