前言
虽然Lua是一个动态语言的脚本,但它也是有类型的,它的类型绑定在“值”上面,通过type(obj)可以获得类型的字符串表示。
在Lua的内部,不同类型的值被实现为统一的数据结构TValue,整个虚拟机的执行框架都基于TValue去设计,这样有效的简化了复杂度。
这一篇要对Lua的对象模型进行一个总览,使我们能从全局上看到Lua的对象框架。而具体的类型实现,则留待后面再说。这部分结构定义在:lua.h, lobject.h, lstate.h
中。
核心对象结构
Lua所有类型的对象都由TValue这个结构表示:
typedef struct lua_TValue {
Value value_; // 对象的值
int tt_; // 对象类型
} TValue;
tt_决定了对象的类型,它的内存布局是这样的:
- 第0~3位:为对象类型,由下面宏定义:
#define LUA_TNIL 0
#define LUA_TBOOLEAN 1
#define LUA_TLIGHTUSERDATA 2
#define LUA_TNUMBER 3
#define LUA_TSTRING 4
#define LUA_TTABLE 5
#define LUA_TFUNCTION 6
#define LUA_TUSERDATA 7
#define LUA_TTHREAD 8
上面一目了然,无须多说;除了这些还有一个函数原型的类型。
#define LUA_TPROTO 9 // 函数原型的类型
- 第4~5位:有三种类型还会细分子类型,函数,字符串,和数字。
函数细分为:Lua闭包,C闭包,轻量的C函数:
#define LUA_TLCL (LUA_TFUNCTION | (0 << 4)) /* Lua closure */
#define LUA_TLCF (LUA_TFUNCTION | (1 << 4)) /* light C function */
#define LUA_TCCL (LUA_TFUNCTION | (2 << 4)) /* C closure */
字符串分为:短字符串,长字符串:
#define LUA_TSHRSTR (LUA_TSTRING | (0 << 4)) /* short strings */
#define LUA_TLNGSTR (LUA_TSTRING | (1 << 4)) /* long strings */
数字分为:浮点数,整数:
#define LUA_TNUMFLT (LUA_TNUMBER | (0 << 4)) /* float numbers */
#define LUA_TNUMINT (LUA_TNUMBER | (1 << 4)) /* integer numbers */
关于这些类型的具体细节,以后再说。
- 第6位:标记是否为可回收对象(GCObject),什么是可回收对象?其实就是动态创建的对象,需要由GC回收。其中
string, table, function, thread, userdata, proto
这些为可回收对象。通过下面宏可判断:
// 可回收位
#define BIT_ISCOLLECTABLE (1 << 6)
// 取对象的类型
#define rttype(o) ((o)->tt_)
// 是否为可回收对象
#define iscollectable(o) (rttype(o) & BIT_ISCOLLECTABLE)
说完了类型,现在来看Value,一个Value能包容所有类型的数据,而又要避免太占空间,在C里面最自然的做法就是使用联合了:
typedef union Value {
GCObject *gc; /* collectable objects */
void *p; /* light userdata */
int b; /* booleans */
lua_CFunction f; /* light C functions */
lua_Integer i; /* integer numbers */
lua_Number n; /* float numbers */
} Value;
其他成员都好理解,主要是gc,它是一个动态创建的对象指针,最后由GC自动回收。如上面所说,有6种对象是可回收对象,它们的内存开头必须和GCObject一致,用面向对象的话说GCObject是它们的父类:
struct GCObject {
GCObject *next; // 指向下一个GC对象,形成链表,GC会用到
lu_byte tt; // 对象类型
lu_byte marked // 对象标记,GC会用到
};
所有可回收对象的结构用下面联合表示,该联合主要用于类型强制转换:
union GCUnion {
GCObject gc; // 公共头
struct TString ts; // 字符串
struct Udata u; // 完整的UserData
union Closure cl; // 闭包联合,里面又分为C闭包和Lua闭包
struct Table h; // 表
struct Proto p; // 原型
struct lua_State th; // Lua线程
};
总览图
将上面的数据结构概括起来,可用下图表示:
在lobject.h
和lstate.h
中还有一些辅助宏用于操作这些结构,具体请查看相关源码,这里不再列出。