生物信息学
文章平均质量分 78
拾年如一
这个作者很懒,什么都没留下…
展开
-
一篇很特别的文献doi.org/10.3109/01902148.2014.971472
使用双感叹号作为绝对值符号的文献原创 2023-01-28 15:01:22 · 185 阅读 · 0 评论 -
R包安装系列记录
1、tibble安装2、clusterProfiler安装3、affy安装原创 2022-12-03 15:53:24 · 2646 阅读 · 0 评论 -
R包data.table: Extension of ‘data.frame‘
能处理大量数据的data.table。data.frame的扩展原创 2022-12-03 15:29:22 · 209 阅读 · 0 评论 -
GPU的配置
做多少更新多少,算作一个学习记录,记录我配环境配出的各种坑和由于制杖给自己挖的坑23331、cmd使用nvidia-smi查看显卡的型号根据显卡型号下载对应的驱动 https://www.nvidia.com/Download/index.aspx#我的是NVIDIA-SMI 462.31 Driver Version: 462.31 CUDA Version: 11.2#关于CUDA的版本,看电脑上的NVIDIA设置系统信息有可能是不准确的,据大佬说它显示的...原创 2021-08-06 21:34:04 · 1269 阅读 · 0 评论 -
DisGeNET的初步认识
在看疾病与基因组的关系时发现了该数据库,其中有一些分值的计算很有趣,特此记录下来供后续参考学习。本文资料来自于https://www.disgenet.org 的About页面。DisGeNET Metrics DisGeNET指标We have developed two scores to rank the gene-disease, and the variant-disease associations according to their level of evidence. Thes原创 2021-05-22 17:51:12 · 7444 阅读 · 0 评论 -
搞个包吧,机器学习我不学imblearn篇
安装一个有毒的包之imblearn起因毒的过程等待结果中起因手头有一个研究方向相关的生信数据集,由于是一个二分类问题,其中一类因为大佬们近些年才开始搞所以文献中提取的确认是该类的数据特别少。我尝试训练模型的途中读到《面向数据科学家的实用统计学》一书中提了一小段,据说有个处理不平衡数据集的好东西,于是就来搜索尝试了。毒的过程我开始天真的以为只要conda install就好,然后各种报错,一会语法错误,改成pip还是报错:Note: you may need to restart the kernel原创 2021-02-14 23:02:38 · 464 阅读 · 0 评论 -
CD-HIT的使用
继续我的生信笔记系列。从某网站的附带文献中读到该工具,搜索了一下,发现网上的大佬们都在讲如何用它去冗余,相对官方页面的介绍而言很是片面,于是刚好有聚类的需求的我准备对其全体功能做做实验,学习一下由李伟忠博士在伯纳姆研究所(现为桑福德伯纳姆医学研究所)亚当·戈兹克博士的实验室开发的牛工具。首先是官方介绍:CD-HIT是一个非常广泛使用的程序,用于蛋白质或核苷酸序列的聚类和比较。最初由李伟忠博士在伯纳姆研究所(现为桑福德伯纳姆医学研究所)亚当·戈兹克博士的实验室开发,CD-HIT速度非常快,可以处理非常原创 2021-02-16 21:33:11 · 15694 阅读 · 7 评论