参考 python蟒蛇书,开始学习之前思考几个问题。
1.你的学习目的是为了什么?
对我来说,1.同样的分析/数据整理,其它人用python实现,代码简洁、速度快;2.最初目的是为了看得懂其它人的代码;3.自己会用简介的语句实现与R相同的需求。
最重要的一点:当数据量很大的时候,R容易卡/ 运行速度极慢,读入输出都慢,需要借助dara.table包
2.你最想做的3个程序是什么
小目标:1.提取行列;2.按分隔符分割文件;3.匹配;4.判断if;5.循环;6.重新输出数据框,简而言之就是将数据整理成目标格式。
目标实现流程:
示例1:如何将每个样本的表达量数据,整理为所有样本的表达量矩阵(可能涉及匹配、行列转换、合并行/列);
示例2:手动将目标QTL区间内基因,对应在基因组注释文件里区间的基因挑选出来(可能涉及区间判断,QTL左右边界pos值,与基因组注释文件SNP位置大小比较,然后挑选区间基因)
桌面小工具:1.比如匹配2个文件,输出重复,输出唯一值;
【推荐参考】
书籍:python蟒蛇书 、python基础教程