都AI时代了,难道生信分析还需要学Linux和编程语言?

俗话说得好,做不好饭的机械不是一个好程序员,作为一个早期从事机械设计和有限元分析的天津大学食品系的生信狗,入坑生物信息好几年了,一直在思考的问题是为什么生信必须得“有码”操作。就像早期的有限元一样,都是需要自己配置服务器然后拼凑起来运行各式各样的开源计算模块,但是现在谁不是拿comsol、ansys、abqus一把梭哈。以前搞有限元得精通服务器和编程,但是现在在有限元群里面请教怎么搞Linux和编写分析算法要自己运行真的不敢相信。让机械专业的搞服务器和编程已经是反人性的,那么让学生物的学精通Linux和编程岂不是更逆天!

但是都AI时代了啊,为什么我们一帮农学医学生物学的搞点生信还得学的比很多计算机专业还深??????????????????

以前呢,我认为这个问题是无解的,因为生信和有限元在计算模式上就是本质性的不同,搞有限元买的都是一台工作站,搞生信的得买一排服务器外加一个大号NAS。所以解决有限元的0代码化只需要封装一个UI软件,模型也就是几十MB,微信一传,一人一台就可以开工了,只有极少数的巨型计算需要用超算,能用到超算的也是服务百万千万级别的大工程项目,都是极少极少的专业性需求,一次是一群人去服务同一个样本。但是生信这玩意经常就是一堆样本,小课题那数据量再小也是几十GB,大的动辄几十几百TB,对成本还极度敏感,背后也没有大工程托底,一个样本又要算几个小时乃至一天,一般只能是一个人弄很多个样本,数据量还奇大无比,按云计算流量0.3元/GB算的话,算一个压缩完30GB的样本光上下行流量不能投入20块吧,1核时两三毛,远超自建集群,本来想用云计算偷个懒的也被价格劝退了。

但是自建集群对于生农医化的学生来说也是挺要命的,我作为半专业电脑修理工在生农医圈真的是苦不堪言,天天都是找我给修电脑的,修电脑的问题比真研究生信的还多。包括但不限于怎么安Linux操作系统?怎么配环境?服务器什么配置?AVX512和SIMD是什么为什么这玩意对生信分析那么重要?我想买AMD ZEN2的服务器行不行,店家都给我推荐这个,据说性价比比Intel高得多?怎么分配用户?怎么做文件管理?怎么安装软件?怎么下载数据?为什么我按Del进不去BIOS?怎么登录服务器?我明明已经把操作系统安装成功了页面去哪了,为什么黑屏上面只有白色英文?C盘去哪了?为什么输入Python没反应?什么是权限为什么我运行了没反应?你能不能给我们弄好就锁起来让学生不动了,以后别出问题?我们都是搞生物的,能正常算别出问题就行,不需要服务器太复杂???(绝望脸)据不完全统计,生农医化相关学院大概7成算力处于闲置状态,还有2成被学生搞坏以后还没有修好或是至今还没有配上环境,所以还不如外包分析得了,就学学下游会拿工作站画图就行。

但是归根到底其实生信分析无非也就是两个环节,上游各样本的数据整理和特异性信息挖掘、下游多样本联合现实世界的含义分析。下游相对是AI最容易解决的,而且下游多样本联合分析是汇总成了一个项目也非常适合自己的工作站上运行不需要集群。

以前我们画一张热图或者遗传树可能需要学挺长时间的R或者Python,然后down一个代码开始改,现在有了AI,不少工作可以直接出图,也可以让AI写一个代码,复制粘贴以后双击运行,想让AI改几遍就几遍,图就直接出来了,只需要配置一个性能稍微高一点的工作站台式机,内存大点基本上多样本联合分析都能搞定,想让AI改几遍他就给你瞬间改几遍,一天就能把这个类型研究所有分析的图几乎全部出出来,再也不用像以前一样和科服公司改一个图就拉拉扯扯几个月。

推荐的AI平台:清华的智谱清言、阿里的通义千问、Kimi等等都非常好用,基本上把提示词写好代码都是完美运行。

上游低成本的0代码生信分析其实靠去中心化生物超算也就解决了,一个样本淘宝买也就几块钱十几块钱,样本不多的话也可以去抢免费的算力路由器用,课题组花一个买中低配NAS的钱也就把生信基本上终身全搞定了,一次投递能投几百个样本同时计算,要是没有合适的算法也就两周左右就能给免费改完上架。把样本往算力路由器一塞,指令一发,服务器和算法都是根据各式各样的特点以及指令集专门调试的,实测平均是自己直接运行的平均两三倍速度,像GATK这些复杂的自己配的服务器可能速度是七八千regions/min(数据来源于华中农大作重计算平台),但是专业调教后硬件调试好的平均七八万regions/min,高的十几万regions都很正常,十几倍速度啊,十几倍!一条染色体10X深度的10min就算完了。啥服务器也不用买,也不吵不热,数据都是跑满带宽极速上传的,命令一发,等一会结果就存回本地算力路由器了,弄个2.5G的网卡,直接分分钟就取回自己PC可以做下游了,拿到fastq数据了一天就能出图写论文,或者从采集样本到算出育种值合计三四天就能开始实操育种都不是问题。

推荐一个超便宜超好用超靠谱服务超满意网速嘎嘎快的超算平台-DNAParse官网:https://lowcode-8gimghlkf6219ad9-1301532823.tcloudbaseapp.com/app-vuSiN7TG/production/

如果您也认可我们对生物产业未来的期待,还请您帮忙多多转发,让我们一起推动全面生物经济时代的到来,让生物成为下一个改变世界的朝阳产业!如果有任何侵权或是内容错误,恳请您及时联系我,定将第一时间改正,深表感谢!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值