数据分析
文章平均质量分 96
pingu的生信备忘录
公主号:pingu的生信备忘录,分享关于pingu的生信技能和知识
展开
-
IGV——基因组可视化
例如,查看转录组数据不同区域的Reads丰度,不同样本的基因表达差异,查找SNP位点,查看甲基化,查看基因结构信息。(3)如果在本地可视化,需要将 bam 和 bai 或 bigwig 文件从 linux 系统上传到本地,且放置在同一个文件夹下,如果服务器搭建有 ftp 站点则可以直接使用 url 载入,也可以将数据上传至可以接受外部访问的服务器(如 https://de.cyverse.org/dashboard )上再使用 url 载入,具体可参考教程《通过 url 访问服务器文件》。原创 2024-09-09 21:05:24 · 1522 阅读 · 0 评论 -
ClusterGVis——时间序列聚类可视化
文章目录ClusterGVis——时间序列聚类可视化安装使用1. 输入2. 确定最佳聚类数目3. 聚类4. 输出5. 可视化(1)折线图(2)热图(3)热图 + 折线图/箱形图/GO富集补充报错参考ClusterGVis——时间序列聚类可视化ClusterGVis 提供了时间序列的 RNA-seq 数据的模糊 c-means 算法和 kmeans 算法聚类的可视化,还可以实现对 WGCNA 输出的可视化,同时可以使用 clusterProfiler 的 enrichCluster 完成每个 cluste原创 2024-09-05 09:54:17 · 524 阅读 · 0 评论 -
CPAT——lncRNA编码能力预测(一)
对于转录组测序的数据而言,组装得到转录本之后,首先要做的就是区分蛋白编码和非蛋白编码的RNA。第一种算法基于序列比对,可以较好的识别保守性较好的蛋白编码基因,包括CPCPhyloCSF等软件;第二种算法不需要比对,而是通过 coding 和 non-coding 转录本的序列特征来进行区分,包括CNCICPATPLEK等。原创 2024-08-28 18:41:44 · 1182 阅读 · 0 评论 -
clust——共表达聚类
clust 是一种用于识别在一个或多个物种的异构数据集中持续共表达(相关性良好)的基因簇(组)的全自动方法。原创 2024-08-11 16:15:54 · 1062 阅读 · 0 评论 -
Mfuzz——时间序列聚类
Mfuzz 工具采用算法,根据具有时间序列特征的转录组、蛋白质组数据中基因或蛋白表达的时间趋势,对具有相同表达模式的基因或蛋白划分 cluster。相较于传统的统计学显著的上下调基因分组,Mfuzz 可以实现更为多元的生物学实验设计的基因聚类,如的实验。迄今为止的聚类大多为硬聚类(K-means 等算法),即将每个基因或蛋白质都完全分配给一个聚类,但在实际情况中,基因/蛋白质簇经常会出现重叠,且硬聚类算法通常对噪声十分敏感。为了克服硬聚类的局限性,Mfuzz 采用了。原创 2024-08-09 19:55:06 · 1076 阅读 · 0 评论