- 博客(178)
- 资源 (4)
- 收藏
- 关注
原创 博客摘录「 【Nature Reviews】AI在医疗领域的下一步:计算病理学如何赢得临床医生的信任和采用?」2024年9月14日
为了解决这个问题,需要在模型中引入能够捕捉图像块之间关联的机制,如图像块间的关系建模、全局特征提取、或者使用能够处理大尺寸输入的模型架构(例如基于Transformer的模型、图神经网络等),以更好地利用全切片图像的完整信息,提高预测性能。如果我们将图像划分成多个小的图像块(patch),并假设这些图像块彼此独立,仅利用每个图像块内部的上下文信息,而不考虑图像块之间的关联和整体组织结构,那么这种方法会有明显的局限性。:假设图像块彼此独立,意味着模型只能利用每个图像块内部的细节信息,如细胞的形态、染色等。
2024-09-14 15:10:40 201
原创 rearrange(h, ‘b (ws w) c -> b w ws c‘, ws=4)和rearrange(h, ‘b (w ws) c -> b w ws c‘, ws=4)的区别
rearrange(h, 'b (ws w) c -> b w ws c', ws=4)和rearrange(h, 'b (w ws) c -> b w ws c', ws=4)的区别
2024-04-22 20:35:41 210 1
原创 Driver install fails with the error [An error occurred while performing the step: “building kernel m
这是 Ubuntu 内核的问题。ubuntu内核团队决定使用gcc-12进行内核编译,而22.04系统编译器是gcc-11。请从 ubuntu 存储库安装 gcc-12,以便能够再次编译 nvidia 模块。
2024-03-14 20:13:49 455
原创 webDAV + aliyundriver + 阿里云盘 实现免费的云存储云同步
只需要简单的配置一下,就可以让阿里云盘变身为webdav协议的文件服务器。基于此,你可以把阿里云盘挂载为Windows、Linux、Mac系统的磁盘,可以通过NAS系统做文件管理或文件同步;
2023-07-23 16:26:28 7303
原创 爬虫的xpath
‘return document.body.scrollHeight’‘window.scrollTo(0,-200)’‘window.scrollTo(0,document.body.scrollHeight)’‘return document.body.scrollHeight’url = ‘https://www.heycan.com/material#paster’‘xpath’, ‘//*[@id=“root”]/section/main/section/div/div[2]/div[1]/div
2023-07-08 10:01:53 612
原创 音频特征提取
它表示音频信号频谱的复杂程度或不确定性,可以用于识别音频中的不同声音,例如不同乐器的音色。谱熵特征通常与其他特征(如MFCC、零交叉率、能量、谱滚降点和谱通量)结合使用,以提高音频处理任务的性能。色度特征通常与其他特征(如MFCC、零交叉率、能量、谱滚降点、谱通量和谱熵)结合使用,以提高音频处理任务的性能。它表示音频信号频谱的变化程度,可以用于检测音频中的事件,例如音符的开始和结束。它表示音频信号的振幅大小,可以用于识别信号中的不同声音,例如辅音和元音,以及不同乐器的音色。
2023-03-17 16:47:31 4842 1
原创 python中的多进程和多线程
进程是程序在计算机上的一次执行活动,就是正在运行的应用程序,通常成为进程。每一个进程有自己独立的地址空间(内存空间)。线程是一个轻量级的子进程,是最小的处理单元;线程是进程的子集,一个进程可以由多个线程组成;多线程是指有多个线程存在于进程中,这些线程之间共享进程的资源。,一个线程只能属于一个进程,一个进程可以拥有多个线程;
2023-03-16 19:55:15 1524
原创 对 /dev/shm 认识
因此在linux下,就不需要大费周折去建 ramdisk,直接使用/dev/shm/就可达到很好的优化效果。/dev /shm/需要注意的一个是容量问题,在linux下,它。,使用df -h命令可以看到。但它并不会真正的占用这块内存,如果/dev/shm/下没有任何文件,它占用的内存实际上就是0字节;是linux下一个非常有用的目录,因为。
2023-03-16 10:13:18 151
原创 Linux wget爬虫命令
查看网站URL是否正常最常见的方式莫过于使用wget和curl工具来活动网站的URL信息;–q, --quit 安静的访问,禁止输出,类似于 -o 、dev/null。–o, --output-file=FILE,记录输出到文件中。–spider 模拟爬虫的行为去访问网站,但是不会下载网站。实时监控的方式:(利用放回值确定网站是否正常)=> 输出 0 表示上个命令执行正常。–T, 网站访问超时的时间。–t,网站异常时重试的次数。
2023-02-21 14:59:01 702
原创 Flask中第一个参数__name__的含义
如果 test.py 模块位于一个名为 my_package 的 Python 包中,那么 __name__的值就是 my_package.test。我们在使用Flask框架时,创建一个app,需要用到Flask(__name__)的语句;中名为 test.py 的模块中,__name__的值为 test。
2023-02-20 13:49:17 310
原创 python定义类的时候继承object类
区别在于python2和python3,python3继承不继承object类都没有区别,但是python2继承object类的话,可以获得更多的魔术方法(静态方法,类方法的构造,类属性的快速访问,定制类实例的实现方法)。
2023-02-17 09:15:35 307
原创 Python中类对象自带的__str__函数
_str__是Python中类对象自带的一个函数,正常情况下,我们实例化对象后,print对象,输出的是这个对象的地址.而通过自定义__str__()函数,可以帮我们打印对象中的内容。
2023-02-16 15:42:26 466
原创 常见shell命令
shell 命令shell 命令含义$0当前脚本的文件名$n传递给脚本的参数$#传递给脚本的参数的个数$*传递给脚本的所有参数$@传递给脚本的所有参数$?上个命令的退出状态,或者函数的返回值$$当前shell的进程ID-n字符串长度是否不为0,若不为0则为True-d目录是否存在,若存在则为True-h是否是软链接,若是,则为True-ltlow than 小于-gegreater equals
2022-12-03 16:48:07 1183
原创 nginx配置参数解释
Nginx是一款轻量级的HTTP服务器,采用事件驱动的异步非阻塞处理方式框架,这让其具有极好的IO性能,时常用于服务端的反向代理和负载均衡。nginx文件是Nginx的总配置文件,在我们搭建服务器时经常调整的文件。使用如下命令打开nginx.conf文件。......
2022-08-30 19:11:23 11767
原创 linux 后台运行并输出log到指定文件
linux 后台运行并输出log到指定文件nohup python -u run_pretrain_nezha.py >run_pretrain_nezha.txt 2>&1 &
2022-05-10 11:11:18 1633
原创 将Jupyter Notebook代码转换为Python脚本
jupyter nbconvert --to script my_notebook.ipynb
2022-01-29 19:16:22 1828
转载 小布助手nlp比赛
1.赛题背景小布助手是OPPO公司为欧加集团三品牌手机和IoT设备自研的语音助手,为用户提供了有趣、贴心、便捷的对话式服务。意图识别是对话系统中的一个核心任务,而对话短文本语义匹配是意图识别的主流算法方案之一。本赛题要求参赛队伍根据脱敏后的短文本query-pair,预测它们是否属于同一语义,提交的结果按照指定的评价指标使用在线评测数据进行评测和排名,得分最优者获胜。2.赛题描述及数据说明训练数据训练数据包含输入query-pair,以及对应的真值。初赛训练样本10万,复赛训练样本30万,这份数据主
2022-01-17 21:42:08 207
原创 Nezha预训练备份
build_model_and_tokenizer(args)def build_model_and_tokenizer(args): tokenizer = BertTokenizer.from_pretrained(args.vocab_path) model_config = NeZhaConfig.from_pretrained(args.pretrain_model_path) model = NeZhaForMaskedLM.from_pretrained(pret.
2022-01-15 00:37:30 824
原创 Pytorch里面的DataLoader的collate_fn参数
DataLoader的collate_fn参数,实现自定义的batch输出。DataLoader完整的参数表如下:class torch.utils.data.DataLoader( dataset, batch_size=1, shuffle=False, sampler=None, batch_sampler=None, num_workers=0, collate_fn=<function default_collate>,
2022-01-13 19:09:23 1363
原创 文本分类,可能有用的tricks
一、稳定有收益的,祖传老方子RNN based model 包括LSTM和GRU,使用双向结构embedding之后使用dropoutensemble集成尽可能找到还原语义的pretrained embedding,实际情况是oov千奇百怪,拼写检查,基本上是100倍的努力,一点点收益,或者拆词,拆字能一定程度上缓解(比如说你要训练一个某个领域(量化投资)的人短信文本分类,有条件下尽量自己拿相近的行业比较大的语聊训练一个词向量,实际上线的遇见比如investvanguard(OOV)【假设一个投资
2022-01-12 23:21:25 326
转载 AEDA:文本分类数据增强
AEDA:AnEasier Data Augmentation Technique for Text Classification论文地址:https://arxiv.org/pdf/2108.13230.pdf代码地址:https://github.com/akkarimi/aeda_nlp为了让模型由更好的泛化能力,一般需要更多的更加全面的数据集,但是数据的收集和标注是很费事费力的,所以这个时候数据增强技术就很重要。在NLP领域,EDA(Easy Data Augmentation Tech
2022-01-09 17:01:26 881
原创 bert模型的输出
bert模型的输出可以包括四个:last_hidden_state:torch.FloatTensor类型的,最后一个隐藏层的序列的输出。大小是(batch_size, sequence_length, hidden_size) sequence_length是我们截取的句子的长度,hidden_size是768.pooler_output: torch.FloatTensor类型的,[CLS]的这个token的输出,输出的大小是(batch_size, hidden_size)hidden_sta
2021-12-30 11:24:56 10116
Microsoft Visual C++ 14.0-15.zip
2020-06-28
基于稳态模式的转差频率控制的交.zip
2019-05-26
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人