芯片无忧的使用教程_芯片探针序列的基因注释已经无需你自己亲自做了

在整个生信技能树的历史上,就分享过两次价值一千元的:

  • 第一次是:TCGA的28篇教程-风险因子关联图-一个价值1000但是迟到的答案
  • 第二次是:(重磅!价值一千元的R代码送给你)芯片探针序列的基因组注释

其中第二个教程是纯粹的R代码技巧,怕粉丝看不懂,我还刻意花了一个星期做铺垫:

  • 1 把fasta序列读入到R里面去
  • 2 使用refGenome加上dplyr玩转gtf文件
  • 3 把bam文件读入R,并且转为grange对象
  • 4 在R里面使用Rsubread完成组学分析全套流程
  • 5 在R里面对坐标进行映射
  • 6 下载所有芯片探针序列并且写成fasta文件

有两个弊端

根据粉丝的反馈,是有两个问题的,首先是该R包在Windows平台是无法使用的,然后是大家下载参考基因组总是搞错!

568f3496056e6203efba7fe1da0bd661.png

还专门有粉丝发邮件求助,问我为什么,他跟着我的教程:(重磅!价值一千元的R代码送给你)芯片探针序列的基因组注释 报错:ERROR: the provided reference sequences include more than 4 billion bases 初步怀疑是电脑配置不够,就升级到了96GB内存,20核心CPU,1.2T硬盘,但是报错依旧!

所以我就让他指明是哪一个步骤代码问题,结果他告诉我下载的1G参考基因组解压后是54G,我的天!

我代码中说的数据库:'Homo_sapiens.GRCh38.dna.toplevel.fa' 因为并没有给出下载的链接,所以导致初学者只能是自己折腾碰壁了,但是正常的生物学背景知识朋友都应该是知道人类参考基因组是3G左右啊!如果你下载的是toplevel版本的基因组: Homo_sapiens.GRCh38.dna.toplevel.fa.gz,文件大小1G,解压后54G!!!实际上用它对应的primary版本就够了:Homo_sapiens.GRCh38.dna.primary_assembly.fa.gzprimary的版本中是不包括haplotype info的,而top level中会包含大量的变异信息,而这部分是很冗余并且一般也用不太到。

其实你可以使用我们的AnnoProbe包

目前仍然是 host 在GitHub上面:https://github.com/jmzeng1314/annoprobe

如果大家觉得有帮助,后续我会考虑抽时间去发布在bioconductor里面,甚至写成SCI文章供大家引用。

以前大家是需要自己下载探针序列进行参考基因组比对后注释,比如我在 (重磅!价值一千元的R代码送给你)芯片探针序列的基因组注释 提到的例子;关于

Human LncRNA Expression Array V4.0 AS-LNC-H-V4.0 20,730 mRNAs and 40,173 LncRNAs 8*60K

这个芯片探针的重新注释,一般文献里面的描述是:

  • probe sequences 探针序列下载
  • uniquely mapped to the human genome (hg19) by Bowtie without mismatch. 参考基因组下载及比对
  • chromosomal position of lncRNA genes based on annotations from GENCODE (Release 23)坐标提取,最后使用bedtools进行坐标映射

但是大部分人是没有linux操作能力,无法完成这个流程,使用我们的包可以轻轻松松达到探针注释的目的!

首先下载安装我们的AnnoProbe包

library(devtools)
install_github("jmzeng1314/AnnoProbe")
library(AnnoProbe)

因为这个包里面并没有加入很多数据,所以理论上会比较容易安装,当然,不排除中国大陆少部分地方基本上连GitHub都无法访问。

然后使用AnnoProbe包获取探针注释信息

# GPL21827[Accession] - GEO DataSets Result - NCBI - NIH
# https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GPL21827
gpl='GPL21827'
probe2gene=idmap(gpl,type = 'pipe')
head(probe2gene)

轻轻松松的几行代码,就拿到了探针的注释信息哦

2b39d72d0ff6f0bba81a25d4ccadec5b.png

是不是很激动?

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
量产必备-量产前检测一下保证量产成功率! 好消息芯片无忧1.5支持U盘性能评分了,赶紧看看你的U盘能得多少分,官方说明小于30分的U盘可能为扩容盘或者山寨U盘假U盘等,我的博帝飚速盘84分。 芯片无忧1.5支持检测固态硬盘信息啦!赶紧下载看看你的固态硬盘内部芯片信息吧。 想必经常U盘系统的对芯片检测都不陌生吧,新一代的u盘芯片检测软件(ChipEasy)芯片无忧检测结果却比芯片精灵要精准得多,其最大的特色在于联网实时查询,更加加大了此软件的精确性,精确的主控芯片和闪存芯片检测结果,是款不错的软件,特别适合需要量产的人士。 支持USB3.0的擎泰6221主控及详细闪存检测 ============== 1.6 Beta1 测试中,更新细节稍后附上。 更新内容: 1.5.6更新如下: 1、支持擎泰USB3.0 SK6221主控检测; 2、支持联阳主控上次量产时间、上次量产工具版本、通道数显示; 3、修正其他内部错误,提高软件性能。 1.5.5更新如下: 1、修正芯邦主控检测异常以及程序内部错误; 2、完善代码,提高程序速度; 1.5.4更新如下: 1、解决安国主控不能离线识别闪存问题; 2、修正非管理员权限不能识别SSD问题,若WIN7下非管理员身份运行,新版会提示是否授权访问磁盘驱动器; 3、修正群联USB3.0型号显示; 4、修正误识别迈科微BUG; 1.5.3更新如下: 1、解决IS902 识别后打不开盘符问题; 2、增加离线闪存类型(MLC/TLC/SLC)识别; 3、增加SSD固态硬盘指令集探测; 4、增加显示检测系统版本信息; 5、增加SSD固态硬盘模式显示(AHCI/IDE); 6、修正更多细节的功能等等 1.5.2更新如下: 1、增加U盘得分功能,根据U盘获取到的信息给U盘评分; 2、增加DM8261主控、闪存识别; 3、提高擎泰SK6226主控、闪存识别能力; 4、提高迈科微主控、闪存识别能力; 5、提高了银灿IS902、IS916闪存识别能力; 6、修正更多细节的功能等等。 1.5.1更新如下: 1、支持多线程扫描,避免双击运行后反应迟缓问题; 2、在U盘闪存不是很劣质前提下,识别出盘体使用的闪存数量、闪存总容量(慧荣、安国、芯邦、迈科微)、通道数; 3、修正了SSS6691/SSS6692不能识别闪存的BUG; 4、修正了银灿IS916主控在大容量盘下识别乱码问题,闪存识别功能待测; 5、重新排版、改变了字体显示; 6、修正更多细节的功能等等。 V1.5.0版本更新: 1、修正了部分老硬盘误判SSD问题; 2、优化了代码,减少了网络查询请求量,提供运行效率; 3、重新规划了结构,提高了新插盘、拔出盘瞬间的识别效率; 4、增加SSD 固态硬盘SandForce主控检测功能。 此软件为绿色版,解压即用。 软件在WindowsXP、Windows7下测试无误。并通过卡巴斯基2010安全检测 芯片无忧 由U盘之家技术团队全力打造,为了方便广大量产朋友而专门开发的工具。主要功能如下: 一、查看USB设备PID、VID、SN、制造商、产品名等; 二、查看USB设备主控芯片信息; 三、查看USB设备闪存芯片信息; 四、查看USB设备固件信息; 五、查看USB设备电流控制; 为了保证查询结果的准确性,软件需要实时联网查询。 软件病毒扫描说明: 软件在XP/WIN7下开发并测试无误,绿色无需安装,解压即用,通过卡巴斯基2010/2012扫描; 提供下载的压缩包经过在线杀毒(国内外近40中杀毒引擎),完全通过,请大家放心使用。 注:量产网所提供芯片无忧 V1.6(ChipEasy)U盘固态硬盘检测工具 量产必备软件,版权归源作者或公司所有。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值