java如何解析图片里面文字_Java开发大型互联网Class简介之如何实现一个Java Class解析器...

引言

Class是一种在网络工程中的一种协议。一般组词为“CLASSLESS”(无类)或者“CLASSFUL”(有类)。面向对象编程中一个无明显特点的范畴,用于描述一组更具体的称为对象的东西。另有日本乐队组合名称也为CLASS。同时,class也是C++语言中的关键字,在matlab中class用于获取变量的类型。

Class简介

在C++中,程序员用类 来描述 对象, 所谓的对象是指现实世界中的一切事物。那么类就可以看做是对相似事物的抽象, 找到这些不同事物间的共同点, 如自行车和摩托车, 首先他们都属于对象, 并且具有一定得相同点, 和一些不同点, 相同点如他们都有质量、都有两个轮子, 都是属于交通工具等。都有质量、两个轮子属于这个对象的属性, 而都能够当做交通工具属于该对象具有的行为, 也称方法。 类是属于用户自定义的数据类型, 并且该类型的数据具有一定的行为能力, 也就是类中说描述的方法。通常来说, 一个类的定义包含两部分的内容, 一是该类的属性, 另一部分是它所拥有的方法。以 人类 这个类来说, 每个人都有自己的姓名、年龄、出生日期、体重等, 为人类的属性部分, 此外, 人能够吃饭、睡觉、行走、说话等属于人类所具有的行为。 上面举例中所描述的 人 类仅仅是具有人这种对象的最基础的一些属性和行为, 可以称之为人的基类。 再说说一些具有一些职业的人, 例如学生, 一个学生还具有基类中所没有的属性, 如学校、班级、学号; 也可以具有基类所不具有的行为, 如每天需要去上课, 需要考试等。 学生类可以看做是基类的一个扩展, 因为他具有基类的所有属性和行为, 并且在此基础上增加了一些基类所没有的属性和行为, 像学生这样的类称为人类这个基类的派生类或者子类。在学生的基础上还可以进一步的扩展出其他更高级的类, 如研究生类。

f1bc6d72387d742bc7f304a45079e0c3.png

class类有什么用?

class类的实例表示java应用运行时的类(class ans enum)或接口(interface and annotation)(每个java类运行时都在JVM里表现为一个class对象,可通过类名class,类型.getClass(),Class.forName("类名")等方法获取class对象)。

数组同样也被映射为为class 对象的一个类,所有具有相同元素类型和维数的数组都共享该Class 对象。基本类型boolean,byte,char,short,int,long,float,double和关键字void同样表现为class 对象。

class方法

class类的方法还是挺多的。主要是用于得到运行时类的相关信息(可用于反射)。 重要的几个方法: 1, public static Class> forName(String className) :natice 方法,动态加载类。非常重要。 如在sql中动态加载驱动程序:class.forName(sqlDriver); 2,public T newInstance() :根据对象的class新建一个对象,用于反射。非常重要。 可用在反射中构建对象,调用对象方法: class doubleClass= class.forName("java.lang.Double");

Class文件

作为类或者接口信息的载体,每个Class文件都完整的定义了一个类。为了使Java程序可以“编写一次,处处运行”,Java虚拟机规范对Class文件进行了严格的规定。构成Class文件的基本数据单位是字节,这些字节之间不存在任何分隔符,这使得整个Class文件中存储的内容几乎全部是程序运行的必要数据,单个字节无法表示的数据由多个连续的字节来表示。根据Java虚拟机规范,Class文件采用一种类似于C语言结构体的伪结构来存储数据,这种伪结构中只有两种数据类型:无符号数和表。Java虚拟机规范定义了u1、u2、u4和u8来分别表示1个字节、2个字节、4个字节和8个字节的无符号数,无符号数可以用来描述数字、索引引用、数量值或者是字符串。表是由多个无符号数或者其他表作为数据项构成的复合数据类型,表用于描述有层次关系的复合结构的数据,因此整个Class文件本质上就是一张表。在ClassAnalyzer中,byte、short、int和long分别对应u1、u2、u4和u8数据类型,Class文件被描述为如下Java类。

public class ClassFile {

public U4 magic; // magic

public U2 minorVersion; // minor_version

public U2 majorVersion; // major_version

public U2 constantPoolCount; // constant_pool_count

public ConstantPoolInfo[] cpInfo; // cp_info

public U2 accessFlags; // access_flags

public U2 thisClass; // this_class

public U2 superClass; // super_class

public U2 interfacesCount; // interfaces_count

public U2[] interfaces; // interfaces

public U2 fieldsCount; // fields_count

public FieldInfo[] fields; // fields

public U2 methodsCount; // methods_count

public MethodInfo[] methods; // methods

public U2 attributesCount; // attributes_count

public BasicAttributeInfo[] attributes; // attributes

}

如何解析

组成Class文件的各个数据项中,例如魔数、Class文件的版本、访问标志、类索引和父类索引等数据项,它们在每个Class文件中都占用固定数量的字节,在解析时只需要读取相应数量的字节。除此之外,需要灵活处理的主要包括4部分:常量池、字段表集合、方法表集合和属性表集合。字段和方法都可以具备自己的属性,Class本身也有相应的属性,因此,在解析字段表集合和方法表集合的同时也包含了属性表集合的解析。

常量池占据了Class文件很大一部分的数据,用于存储所有的常量信息,包括数字和字符串常量、类名、接口名、字段名和方法名等。Java虚拟机规范定义了多种常量类型,每一种常量类型都有自己的结构。常量池本身是一个表,在解析时有几点需要注意。

  • 每个常量类型都通过一个u1类型的tag来标识。
  • 表头给出的常量池大小(constantPoolCount)比实际大1,例如,如果constantPoolCount等于47,那么常量池中有46项常量。
  • 常量池的索引范围从1开始,例如,如果constantPoolCount等于47,那么常量池的索引范围为1 ~ 46。设计者将第0项空出来的目的是用于表达“不引用任何一个常量池项目”。
  • 如果一个CONSTANT_Long_info或CONSTANT_Double_info结构的项在常量池中的索引为n,则常量池中下一个有效的项的索引为n+2,此时常量池中索引为n+1的项有效但必须被认为不可用。
  • CONSTANT_Utf8_info型常量的结构中包含一个u1类型的tag、一个u2类型的length和由length个u1类型组成的bytes,这length字节的连续数据是一个使用MUTF-8(Modified UTF-8)编码的字符串。MUTF-8与UTF-8并不兼容,主要区别有两点:一是null字符会被编码成2字节(0xC0和0×80);二是补充字符是按照UTF-16拆分为代理对分别编码的,相关细节可以看这里(变种UTF-8)。

属性表用于描述某些场景专有的信息,Class文件、字段表和方法表都有相应的属性表集合。Java虚拟机规范定义了多种属性,ClassAnalyzer目前实现了对常用属性的解析。与常量类型的数据项不同,属性并没有一个tag来标识属性的类型,但是每个属性都包含有一个u2类型的attribute_name_index,attribute_name_index指向常量池中的一个CONSTANT_Utf8_info类型的常量,该常量包含着属性的名称。在解析属性时,ClassAnalyzer正是通过attribute_name_index指向的常量对应的属性名称来得知属性的类型。

字段表用于描述类或者接口中声明的变量,字段包括类级变量以及实例级变量。字段表的结构包含一个u2类型的access_flags、一个u2类型的name_index、一个u2类型的descriptor_index、一个u2类型的attributes_count和attributes_count个attribute_info类型的attributes。我们已经介绍了属性表的解析,attributes的解析方式与属性表的解析方式一致。

Class的文件方法表采用了和字段表相同的存储格式,只是access_flags对应的含义有所不同。方法表包含着一个重要的属性:Code属性。Code属性存储了Java代码编译成的字节码指令,在ClassAnalyzer中,Code对应的Java类如下所示(仅列出了类属性)。

public class Code extends BasicAttributeInfo {

private short maxStack;

private short maxLocals;

private long codeLength;

private byte[] code;

private short exceptionTableLength;

private ExceptionInfo[] exceptionTable;

private short attributesCount;

private BasicAttributeInfo[] attributes;

...

private class ExceptionInfo {

public short startPc;

public short endPc;

public short handlerPc;

public short catchType;

...

}

}

在Code属性中,codeLength和code分别用于存储字节码长度和字节码指令,每条指令即一个字节(u1类型)。在虚拟机执行时,通过读取code中的一个个字节码,并将字节码翻译成相应的指令。另外,虽然codeLength是一个u4类型的值,但是实际上一个方法不允许超过65535条字节码指令。

总结

以 上就是我对Java开发大型互联网Class简介之如何实现一个Java Class解析器 问题及其优化总结,分享给大家,觉得收获的话可以点个关注收藏转发一波喔,谢谢大佬们支持!

最后,每一位读到这里的网友,感谢你们能耐心地看完。希望在成为一名更优秀的Java程序员的道路上,我们可以一起学习、一起进步!都能赢取白富美,走向架构师的人生巅峰!

想了解学习Java方面的技术内容以及Java技术视频的内容可加群:722040762 验证码:头条(06 必过)欢迎大家的加入哟!

75693e5d4f457b8e525bb7cf51aaad66.png
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值