前言
最近发现一个很有用的Eclipse插件:http://andrei.gmxhome.de/bytecode/,可以在Eclipse直接查看,调试Java的字节码。
顺带研究了下Java里异常的实现机制,还有JDK7里的mutil catch的实现原理。
athrow指令
在JVM里实现异常的指令是athrow,指令的参考在这里:http://docs.oracle.com/javase/specs/jvms/se7/html/jvms-6.html#jvms-6.5.athrow
大段的英文就不粘贴过来了:)。
个人理解:JVM是基于所谓的栈帧的(stack frame)的,一个函数调用链就是一个个栈帧组成,当在一个栈里用athrow抛出异常时,JVM会搜索当前函数的异常处理表(参考下面的Class文件分析),如果有找到对应的异常处理的handler,则由这个handler来处理。如果没有,则清理当前栈,再回到上一层栈帧中处理。如果一层层栈帧回退,最终都没有找到Exception Handler,则线程终止。
下面贴点实际代码:
一个简单的函数:
1 | public void testFunc(int i) throws NamingException, XPathException, SQLException { |
前面提到的ByteCode插件给出的分析:
1 | // access flags 0x1 |
如果对汇编有一定了解的话,可以很容易看到,在Java里,抛出一个异常真的是非常简单的:
先New一个异常对象,再把这个对象的引用放到栈顶,再用athrow指令抛出这个异常。
catch块的实现
那下面来看下,从指令层面,是如何处理这个异常的:
首先,处理这个异常的函数:
1 | public void test() { |
ByteCode插件给出的分析:
1 | // access flags 0x1 |
可以看到最开始部分有三条TRYCATCHBLOCK,再分析下这些TRYCATCHBLOCK后面跟着三个标签,最后还有一个异常的名字,再仔细分析下,可以发现三个标签分别对应try块开始的地方,try块结束的地方,catch块开始的地方。这个实际上就是所谓的Execption Table。
class文件格式分析
另外,在Class文件的格式里,我们也可以看到Method的Execption Table。可以看出一个条目有四个元素组成:
start_pc, end_pc, handler_pc, catch_type。显然这些异常表里的数据是和代码位置有关的,和我们上面看到的一致。
1 | Code_attribute { |
所以,我们可以看到,test()函数调用了testFunc()函数,那么,当testFunc()函数里抛出异常时,JVM先回退到test()函数的栈帧,再从Execption Table里查找是否有合适的Execption Hanler,查找首先当前的pc(program counter)要在start_pc, end_pc之间,而且异常的名字要匹配(当然这个应该会被优化成常量的比较,即一个long的比较,不会真的去比较字符串)。如果找到,则跳到对应的handler_pc处继续执行。
finally块的实现
下面再来看下Finally块到底是怎么实现的:
在代码里增加finally块:
1 | public void test2() { |
ByteCode插件的分析:
1 | // access flags 0x1 |
我们可以很神奇的发现,finally块的代码在每一个catch后面都有一份。也就是说finally的实现有点像内联优化,把代码复制了很多份。
JDK7中mutil catch的实现
我们再来看下JDK7新增的mutil catch语法的实现:
1 | public void test3() { |
ByteCode插件的分析:
1 | public test3()V |
我们可以发现,每一个TRYCATCHBLOCK的配置都是一样的,只是异常的名字不一样。所以实际上mutil catch的实现和普通的实现没有太大的区别,当然从JVM的实现角度来看,mutil catch有可能可以优化Exception Handler的查找过程(纯猜测的,如果是线性查找,则效率是一样的)。不过有好处是可以减少class文件的体积,这个也比较有用,因为目前Java的class文件的大小是有限制的。参考这里;http://stackoverflow.com/questions/5497495/maximum-size-of-java-class-exception-table
总结
Java中的异常的实现不是什么太神秘的东东,和人们的直觉的实现差不多。任何编程语言的异常机制都会有一定的开销,但是异常如果没有触发,实际上是没有开销的。
异常在触发时,要new一个异常对象,再一层层地栈帧回退,每层都要查找异常处理表,开销还是比较大的。
所在异常只应该用在合适的地方,如果异常像Switch那样用,那就悲剧了。