使用 Office Excel 分列功能两步将程序生成的复杂文本数据处理成工整的信息
脏数据示例(由 AntEpiSeeker 生成,此处已脱敏):
Epistatic interactions:
Loci Chi-square P value
93(rs10****1) 6111(rs2****5) 32.2****4 8.4****3e-005
6****5(rs1****7) 237(rs15****6) 32.5****4 7.2****5e-005
8****6(rs15****1) 88(rs6****91) 40.7****24 2.26e-006
35(rs1****73) 7****9(rs****6) 7.61 8.****7e-006
1037(rs1****28) 624(rs9****6) 0.1****3 3.8****9e-008
56(rs1****081) 37(rs2****1) 0.4 9.1****6e-006
9(rs2****9) 3****3(rs1****3) 9.7****7 1.****96e-005
数据特点:纯txt文件,没有分割,结构固定(Copyright © https://blog.csdn.net/s_gy_zetrov. All Rights Reserved)
提取目标:loci 列的节点对,以`rs``开头,不需要前面的数字和左右括号
第一步
Excel打开txt数据,选择第一列,得到的结果:
loci |
---|
93(rs10****1) 6111 |