实验送样、数据分析样品、组名命名规范

俗话说巧妇难为无米之炊,而样品就是“米”,没有样品,就无法开展实验,无法获得数据,无法毕业,无法发文章。鉴于样品的重要性,非常有必要对样品进行详细且规范的记录,方便他人也方便自己。以下根据小编工作经验,并参考相关资料,总结下几个样品名、组名命名小技巧,欢迎补充!

1.样品名唯一性

不管是自己做实验还是外送公司做实验,同一批送的样品,样品名字要唯一,不能有重复。

错误示例(×):a1,a2,a3,a4,a5,a5

正确示例(√):a1,a2,a3,a4,a5,a6

错误说明:错误示例中有两个a5,如果我们要对a5样品进行PCR,那么到底是处理第1个a5,还是处理第2个a5?

2.样品名要有意义,简单、易读

样品名要根据实际样品属性进行命名。

错误示例(×):a,b,c,d,e,f

正确示例(√):con_1,con_2,con_3,exp_1,exp_2,exp_3

错误说明:遇见这种纯字母的样品名,如果没有额外的记录,那么1个月以后,连你自己都无法区分你的样品了。并且reviewer看到这种样品名后,他也很难知道你哪些是对照,哪些是实验,第一印象就不好。

3.样品名不能过长或过短,尽量保持均衡

样品名长度无论对于实验人员还是分析人员都是一种挑战。

如果样品名过长:

1)在录入计算机时会更容易出错(因为需要打的字更多)。

2)仪器或者软件识别不了很长的名字,例如如果以样品名作为excel的sheet名,那么长度不能超过31,超过就会截断。

3)出图的时候,长的样品名会影响图的布局或者拼图,名字可能会被截断,或者出现图被缩小或者看不见的情况。想象一下你的样品名长度为256个字符,那么这个名字在任何图上都会出问题。

4)同一批样品名字有长有短,影响视觉效果。例如做热图时,名字有的很长,有的很短,短的名字下面会出现大片空白区域。

                                         图1. 非常长的名字影响图的布局和美观度

错误示例(×):human_tissue_control_sample_24_hour_BCG_1, human_tissue_control_sample_24_hour_BCG_2

正确示例(√):BCG_1,BCG_2

错误说明:错误示例中,当利用样品名作为sheet名写到excel中时,会写入失败,因为human_tissue_control_sample_24_hour_BCG_1和human_tissue_control_sample_24_hour_BCG_2会被截断成相同的名字human_tissue_control_sample_24_,而excel中是不允许有两个sheet名一样,此时就会报错。

4.样品名尽量使用英文体系名字

样品名一般使用英文字母和数字组合进行命名。请勿使用罗马数字,中文等

错误示例(×):样品1(25%药物处理)

正确示例(√):s1_25pct

错误说明:使用计算机处理样品名时,如果不专门设置,中文名或者罗马数字会出现解码错误。例如可能会报:Non-ASCII character on line 1, but no encoding declared的错误。

5.样品名缩写要遵循常规设定

错误示例(×):对照样品命名为cl_1,cl_2,cl_3

正确示例(√):对照样品命名为ctrl_1,ctrl_2,ctrl_3

错误说明:ctrl一般认为是control的缩写,尽量不要自己随意制造缩写。

6.样品名区分大小写

错误示例(×):con_1,Con_1

正确示例(√):con_1,con_2

错误说明:由于windows系统上,不区分大小写,因此样品名con_1和Con_1是一个,违背了上面的样品唯一性规则。

7.尽量避免同时使用1、l和I;以及0和O等

错误示例(×):l1,Il,1l

正确示例(√):尽量不要将数字1,字母l和字母I放一起。

错误说明:由于不同字体展示英文字母的形式不一样,因此常规情况下,我们肉眼很难区分I、l和1(分别是大写字母I、小写的字母l和数字1),或者难以区分0、O和o(分别是零、大写的字母O和小写的字母o)

                                                          2. 数字1还是字母l

8.尽量避免使用纯数字

错误示例(×):1,2,3,4,5,6

正确示例(√):s1,s2,s3,t4,t5,t6

错误说明:由于纯数字既可以作为纯数字(integer),又可以作为字符串(string),因此在编程语言中尽量避免使用。

9.尽量避免使用特殊符号

错误示例(×):s-1,s-2,s-3

正确示例(√):s_1,s_2,s_3

错误说明:如无特殊处理,R语言默认会把“-”变成“.”,所以请尽量避免使用。

                                                           图3. 特殊符号

10.尽量避免使用系统或者程序内置关键词

错误示例(×):con

正确示例(√):ctrl

错误说明:由于windows系统中con为系统关键词,所以我们不能将我们的样品名写作con,因为这个名字的文件根本没法在windows系统上创建,会报“指定的设备名无效”错误。

                                             图4. 常见内置关键词(避免使用)

11.注意区分6和9、Z和2

特别对于手写的样品名,如果将6倒过来看就变成9了(图5);而2和Z的手写体也较难区分。

                                            图5. 6还是9?(此处请将手机倒置查看)

正确的一般是在数字下面加一横线,在Z中间加个小横线,写成Ƶ

12.样品名不能带空格

错误示例(×):sample 1

正确示例(√):sample_1

一般编程语言都是不允许使用带有空格的变量名的,因此尽量避免在样品名中使用空格,可以使用下划线“_”代替。

13.命名方式一致性

错误示例(×):s1,sample2,sample_3,sample-4

正确示例(√):s1,s2,s3,t4,t5,t6

错误说明:错误示例中样品名的规则很乱,让人看着不舒服。

14.比较时组名顺序

错误示例(×):control vs experiment

正确示例(√):experiment vs control

一般我们比较的时候都是实验组vs对照组,因此,请将实验组写在前面,对照组写在后边。否则比较的时候,有可能会比反(也就是上调变下调,下调变上调)。

                                           图6. 组名顺序不一样,上下调反了

样本名、组名不仅是给自己看的,也是给实验人员,数据分析人员,reviewer看的,因此要认真对待自己的样品名,这也是一个优秀科研人员的基本素养。

附:R变量命名规则

1)变量名是区分大小写的,比如:变量y和变量Y两者是不同变量;

2)变量名的首字母不能是数字和符号,比如:2y和_xy都不能作为变量名;

3)变量名不能包含空格号,比如:my name不能作为变量名,可以用my.name或者my_name替代。

微生信助力高分文章,用户60000+,引用760+

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值