目前,我正在设计糖生物学领域的一些格式转换工具.格式转换涉及从文本文件转到字段中标准的
XML文件.大多数情况下,我们获得的数据包含下面的纯文本文件中感兴趣的信息.实际文件在一行中包含所有这些内容.读取和拆分此文本以获取信息是微不足道的(可能不直观),但XML是问题所在.
[][b-D-GlcpNAc]
{[(4+1)][b-D-GlcpNAc]
{[(4+1)][b-D-Manp]
{[(3+1)][a-D-Manp]
{[(2+1)][a-D-Manp]{}
}
[(6+1)][a-D-Manp]
{[(3+1)][a-D-Manp]{}
[(6+1)][a-D-Manp]{}
}
}
}
如何解释这个:
> w-w-w形式的所有东西都是与另一个相关的糖.链接由卷曲{显示.
> 4 1,3 1等表示一种糖与另一种糖上的碳键.因此,前一个碳的第四个碳链接到后一个碳的第一个碳.
> {}这表明没有与糖相关的额外糖
>} curlies只是关闭那一层.
您可以阅读XML并了解链接的工作原理.但如果你们想要更详细的解释,那就问问吧.
XML的外观如下所示.
<?xml version="1.0" encoding="UTF-8"?>
到目前为止,我已经能够轻松获取所有残留字段并将其写入XML.但是我甚至无法为残余连接字段编写伪代码.即使我可以获得有关如何在xml中添加链接信息的帮助和想法,我也会很感激.