mfc 按钮打开excel文件_csv格式的文件使用Excel打开后遇到的尴尬

这几天在做GSEA分析,遇到了一个很郁闷的问题:基因表达数据文件是从R中通过write.csv()函数保存为csv格式,然后使用Excel文件打开、排序以及转换成gct文件,最后进行GSEA分析,但结果很失望,一直报错,打开报错清单:43891 duplicated!,意思就是,有重复的genesymbol,而且是数值。很奇怪?我返回Excel打开的文件找,搜索43891,发现在GENE那一列,确实有两个43891。面临两个问题:1.找到这个43891到底代表是哪个genesymbol;2,如何把它转换回对应的genesymbol。没办法,结合43891所对应的各个样本中的值,去R中搜,可能是哪个基因,最后还是找到了。但无意间,当我把Excel中的文件按GENE排序时,发现如图一的情况。嗯?怎么办?找度娘也没结果。反正知道,一定是csv文件转换成Excel文件时某些设置问题,但就是解决不了。

在无奈之际,既然是csv文件转Excel中出现问题,而Excel文件又是我需要的,为何不把R中的基因表达文件直接保存为xls格式呐?

在使用R处理数据的时候,1.是因为csv格式读入、输出格式简单,参数设置简单,极少bug;2.刚开始使用R时,确实曾考虑过保存为xls格式,当时下载数据包及安装失败,加上1的原因,所有把csv处理危机的格式首选。

今天,在没找到其他办法的情况下,再试一下。

install.packages(“ xlsx”)

然后就下载了好大一页面的内容。

csv文件Excel打开后基因名是这样的:

ae722e06642771c78d305e12bfe90cf9.png

安装R包,保存为xls格式后再次使用Excel打开,原来真实基因名是这样的:

efcfdf4fa852711b8910a31884ff871e.png

最后,附上xlxs包的页面,具体用法大家可以help一下。

8d1467ffb8f7dbf335cbe09cdfa96976.png

嘿,竟然可以了。然后,然后就不存在上述问题了。

啰里啰嗦,就当是记录一下。也提醒自己,在最绝望的时候,也不要灰心,改变思维,相信一切都会变好的。上帝在给你关上一扇门的同时,也会给你打开一面窗。


学习的过程就是分享的过程,分享的过程也是交流的过程,交流的过程就是进步的过程。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值