写虚拟机的第一步,就遇到常量池解析。
参阅Java虚拟机规范及众多资料,可以知道class文件的格式,常量池位于class文件的前面。
常量池由若干个常量池项组成,常量池项的一般结构是(C/C++描述):
typedef unsigned int u4;
typedef unsigned short u2;
typedef unsigned char u1;
struct cp_info
{
u1 tag;
u1 *info;
};
其中tag区分了不同的常量池项。每种常量池项各有其结构,长度也可能不同。例如几种常量池项如下:
struct CONSTANT_Class_info
{
u1 tag;
u2 name_index; //常量池中的一个索引,该索引处的常量项必须是一个CONSTANT_Utf8_info
};
struct CONSTANT_Fieldref_info
{
u1 tag;
u2 class_index; //常量池索引,必须指向一个CONSTANT_Class_info
u2 name_and_type_index; //常量池索引,必须指向一个CONSTANT_NameAndType_info
};
struct CONSTANT_NameAndType_info
{
u1 tag;
u2 name_index; //field或method的简单名字。该索引必须指向一个CONSTANT_Utf8_info
u2 descriptor_index; //field或method的描述符。该索引必须指向一个CONSTANT_Utf8_info
};
struct CONSTANT_String_info
{
u1 tag;
u2 string_index; //常量池索引,必须指向一个CONSTANT_Utf8_info
};
struct CONSTANT_Utf8_info
{
public:
u1 tag;
u2 length;
u1 *bytes; //bytes的长度为length
};
上面只是举例,实际上有十几种常量池项。
解析常量池遇到的问题是:如何把class文件中的常量池,变成虚拟机内部的数据结构?这个内部的表示,也被称为运行时常量池。
我的打算是:首先把class文件完整读入内存,因为一个class文件通常不会十分巨大,这样做出于效率,出于实际,是可以接受的。
然后快速浏览一遍常量池,(可以考虑在浏览中顺便执行一些检查?如一些常量池索引是否越界),在浏览中计算,各个常量池项的长度之和。
根据计算出来的所有项长度之和,申请一个数组,准备保存所有的常量项。另申请一个数组,这个数组中的元素内容是指针,每个指针指向前一个数组中的一个常量项。