python perl 比较生信_生信分析人员如何系统入门perl?

perl语言在老一辈的生物信息学分析人员中非常流行,所以因为历史遗留原因大家肯定会或多或少的接触perl,即使你再怎么推崇python或者GO。

perl是典型的脚本语言,短小精悍,非常容易上手,尤其适合处理文本,数据,以及系统管理。

简单给几个资料吧:

还有大小骆驼书,建议都看完,以囫囵吞枣的方式阅读,只看基础知识来入门,难点全部跳过。

在看书的同时,你必须记住和熟练使用的知识点是下面这些:

首先要理解perl里面的三种变量表示方式:

$ 表示单个变量  用单双引号区别,q(),qq()

@ 表示多个变量组成的数组,qw()

% 表示关系型变量-hash

变量不严格区分类型,没有int/float/double/char这样的概念

以及对这些简单变量的操作函数

# Numerical operators:  , <=, >=, ==, !=, <=>, +, *

# String operators:    lt, gt, le, ge, eq, ne, cmp, ., x

数组操作(pop/push/shift/unshift/splice/map/grep/join/split/sort/reverse)

hash操作方式(keys,values,each,delete,exists)

变量内容交换,字符型转为数值型,字符串转为字符数组,字符串变量,heredoc,字符串分割,字符串截取,

随机数生成,取整,各种概率分布数,多维矩阵如何操作,进制转换

hash翻转,数组转hash

上下文环境

就是需要理解你写的程序是如何判断你的变量的,你以为的不一定是你以为的

正则表达式

这也是一个非常重要的一块内容,基础用法就是m和s,一个匹配,一个替换,比较有趣的就是$1,$2等等捕获变量。

(=~ s{^https?://}{}   =~ m{///})

内建变量

就是perl语言设计的时候定义了一大堆的全局变量($_  $, $0 $> $< $! $. @ARGV @F @_ @INC %ENV %SIG

外表上看起来都是一个$/@/%符号后面加上一大堆的奇奇怪怪的字符,表示一些特殊变量,这也是perl语言饱受诟病的原因。

但是有些非常重要,懂了它之后写程序会方便

下载一个表格,里面有近100个预定义变量需要学习的

控制语句(循环/条件/判断)

if ... elsif ... else ...

unless/while/next/last/for/foreach

读写文件,脚本实战!

while(<>){

#do something !

}

这是我最喜欢的一个程序模板,读取文件,根据需要处理文件,然后输出。

需要实现非常多的功能,然后就可以自己总结脚本技巧,也能完全掌握perl的各种语法。

在生物信息学领域,需要实现的功能有!

perl 单行命令

学习单行命令的前提是掌握非常多的奇奇怪怪的perl自定义变量,和perl的基础语法,用熟练了之后就非常方便,很多生物信息学数据处理过程我现在基本不写脚本,都是直接写一行命令,完全代替了shell脚本里面的awk、sed/grep系列命令。

(-p -a -n -a -l -i -F -M)

预定义函数

perl 是一个非常精简的语言,自定义的函数非常少,连min max这样常见的函数都没有,如果你需要使用这样的功能,要么自己写一个函数,要么使用加强版的包,perl的包非常多。

下面列出一些,我常用的包

程序必备 use/die/warn/print/open/close/<>/

数学函数sin/cos/log/abs/rand/srand/sqrt

字符串函数 uc/lc/scaler/index/rindex/length/pos/substr/sprintf/chop/chomp/hex/int/oct/ord/chr/unpack/unencode

defined/undef

系统操作相关

perl语言是跨平台的,因为它的执行靠的是perl解释器,而perl的解释器可以安装在任何机器上面。所以可以用perl来代替很多系统管理工作。

系统命令调用

文件句柄操作(STDIN,STDOUT,STDERR,ARGV,DATA,)

系统文件管理(mkdir/chdir/opendir/closedir/readdir/telldir/rmdir/)

一些高级技巧

自定义函数 sub , 参数传递,数组传递,返回值

模块操作(模块安装,加载,模块路径,模块函数引用)

引用(变量的变量)

选择一个好的编辑器-编译器,editplus,notepad++,jEdit,编程习惯的养成。

搞清楚perl版本的问题,还有程序编码的问题,中文显示的问题

程序调试

perl常见模块学习

perl和LWP/HTML做网络爬虫必备,重点是DOM如何解析

perl和CGI编程,做网站的神器,重点是html基础知识

DBI相关数据库,用perl来操作mysql等,当然,重点是mysql知识

GD and GD::Graph 可以用来画图,但是基本上没有人用了,除了CIRCOS画圈圈图火起来了。

TK模块,可以编写GUI界面程序,但是也几乎没有人用了。

XML/pdf/excel/Json 相关的模块可以用来读取非文本格式数据,或者输出格式化报告。

socket通信相关,高手甚至可以写出一个QQ的模仿版本

最后不得不提的就是Bioperl了,虽然我从来没有用过,但是它的确对初学者非常有用,大多数人不提倡重复造轮子,但我个人觉得,对初学者来说,重复造轮子是一个非常好的学习方式。大家可以仿造bioperl里面的各个功能,用自己的脚本来实现!

如果你感觉学的差不多了,就可以下载一些复习资料,查漏补缺:

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值