Android MediaProvider数据库模式
摘要: Android MediaProvider 使用 SQLite 数据库存储图片、视频、音频等多媒体文件
的信息,供视频播放器、音乐播放器、图库使用。本文详细分析了 Android MediaProvider
多媒体数据库(以 SDK 2.3.3 为例)的模式(schema),并简要叙述与系统媒体扫描服务
MediaScanner 的交互。
1. 如何提取数据库
以 root 权限进入 adb shell,使用 sqlite3 打开位于手机上
Note:
接着在 sqlite3 执行命令 .schema 即可导出创建数据库的 SQL 语句,也就是数据库模式,具体如下(单击展开代码):
接着还需要把数据库转换成图,手工转换的话就是根据 SQL 语句自行画图;推荐懒人使用自动转换,先使用 adb pull 把数据库导出,再使用 Power Designer 或者 Visio 的逆向工程(Reverse Engineer)功能生成物理数据模型(Physical Data Model)。注意要连接 sqlite 数据库文件的话需要先安装 sqlite 的 ODBC 驱动,教程在这里:SQLite ODBC Driver
2. 数据库模式分析
图片数据库
图片数据库由两个表组成,分别是 images 和 thumbnails,物理数据模型如下所示(Power Designer 逆向工程生成)
Note: 如何数据库物理模型图: 表示此为主键。其余的表名、字段名、数据类型应该都能看明白。
Note: SQLite 从 3.6.19 版才开始支持外键约束,Android 2.3.3 使用的是 3.7.x,但并没有使用此特性,而是通过操作数据库的程序(如 MediaScanner)以及触发器来维护数据库的一致性。这里可以了解 SQLite 的外键支持情况
数据表字段解析如下:
字段 | 解析 |
---|---|
_id | 主键。图片 id,从 1 开始自增 |
_data | 图片绝对路径 |
_size | 文件大小,单位为 byte |
_display_name | 文件名 |
mime_type | 类似于 image/jpeg 的 MIME 类型 |
title | 不带扩展名的文件名 |
date_added | 添加到数据库的时间,单位秒 |
date_modified | 文件最后修改时间,单位秒 |
description | |
picasa_id | 用于 picasa 网络相册 |
isprivate | |
latitude | 纬度,需要照片有 GPS 信息 |
longitude | 经度,需要照片有 GPS 信息 |
datetaken | 取自 EXIF 照片拍摄时间,若为空则等于文件修改时间,单位毫秒 |
orientation | 取自 EXIF 旋转角度,在图库旋转图片也会改变此值 |
mini_thumb_magic | 取小缩略图时生成的一个随机数,见 MediaThumbRequest |
bucket_id | 等于 path.toLowerCase.hashCode(),见 MediaProvider.computeBucketValues() |
bucket_display_name | 直接包含图片的文件夹就是该图片的 bucket,就是文件夹名 |
字段 | 解析 |
---|---|
_id | 主键。缩略图 id,从 1 开始自增 |
_data | 图片绝对路径 |
image_id | 缩略图所对应图片的 id,依赖于 images 表 _id 字段,可建立外键 |
kind | 缩略图类型,1 是大缩略图,2 基本不用,3 是微型缩略图但其信息不保存在数据库 |
width | 缩略图宽度 |
height | 缩略图高度 |
视频数据库
数据表字段解析如下:
字段 | 解析 |
---|---|
_id | 主键。视频 id |
_data | 视频绝对路径 |
_display_name | 文件名 |
_size | 文件大小,单位为 byte |
mime_type | 类似于 video/avi 的 MIME 类型 |
date_added | 添加到数据库的时间,单位秒 |
date_modified | 文件最后修改时间,单位秒 |
title | 不带扩展名的文件名 |
duration | 视频时长,单位毫秒 |
artist | 艺术家 |
album | 专辑名,一般为文件夹名 |
resolution | |
description | |
isprivate | |
tags | |
category | |
language | |
mini_thumb_data | |
latitude | |
longitude | |
datetaken | |
mini_thumb_magic | 取小缩略图时生成的一个随机数,见 MediaThumbRequest |
bucket_id | 等于 path.toLowerCase.hashCode(),见 MediaProvider.computeBucketValues() |
bucket_display_name | 直接包含视频的文件夹就是该图片的 bucket,就是文件夹名 |
bookmark | |
字段 | 解析 |
---|---|
_id | 主键。缩略图 id |
_data | 缩略图绝对路径 |
video_id | 缩略图所对应视频的 id,依赖于 video 表 _id 字段 |
kind | 缩略图类型,1 是大图,视频只能取类型 1 |
width | 缩略图宽度 |
height | 缩略图高度 |
音频数据库
音频数据库是最复杂的,由 10 个表组成。物理数据模型如下所示:
字段 | 解析 |
---|---|
album_id | 主键。专辑 id |
_data | 专辑封面缓存的路径 |
字段 | 解析 |
---|---|
album_id | 主键。专辑 id |
album_key | 全大写字母,用于字母索引 |
album | 专辑名 |
字段 | 解析 |
---|---|
locale | 默认字符编码,例如 zh_CN |
字段 | 解析 |
---|---|
artist_id | 主键。艺术家 id |
artist_key | 全大写字母,用于字母索引 |
artist | 艺术家 |
字段 | 解析 |
---|---|
_id | 主键。流派 id |
name | 流派名称 |
字段 | 解析 |
---|---|
_id | 主键。映射 id |
audio_id | 音频 id |
genre_id | 流派 id |
Note: 为何要建立映射表:为了消除数据冗余。假如有大量音频属于同一流派,如果没有映射表则需要每个音频都需要记录同样的流派数据,有了映射表之后则只有一条记录就够了。这符合数据库设计的第三范式(the 3rd normal form)
字段 | 解析 |
---|---|
_id | 主键。音频 id |
_data | 文件绝对路径 |
_display_name | 文件名 |
_size | 文件大小,单位 byte |
mime_type | 类似于 audio/mpeg 的 MIME 类型 |
date_added | 添加到数据库的时间,单位秒 |
date_modified | 文件最后修改时间,单位秒 |
title | 来自 ID3 信息的标题,无则为不带扩展名的文件名 |
title_key | 全大写字母的标题 |
duration | 时长 |
artist_id | 艺术家 id |
composer | 来自 ID3 信息,作曲家 |
album_id | 专辑 id |
track | 来自 ID3 信息,音轨 |
year | 来自 ID3 信息,年代 |
is_ringtone | 是否铃声,0 或 1 |
is_music | 是否音乐,1 才会在音乐播放器显示 |
is_alarm | 是否闹钟铃声 |
is_notification | 是否通知铃声 |
is_podcast | 是否 podcast |
bookmark | |
字段 | 解析 |
---|---|
_id | 主键。播放列表 id |
_data | |
name | 播放列表名 |
date_added | |
date_modified | |
字段 | 解析 |
---|---|
_id | 主键。映射 id |
audio_id | 音频 id |
playlist_id | 播放列表 id |
play_order | 播放顺序 |
视图
视图类似于表,但并非独立存在,是从其他表里面查询数据得到的。使用视图可以加快数据库查询速度,不用每次都执行复杂的 SQL 语句查询。图如下所示:
Note: 如何看视图:图下面的部分是数据来源的表,中间是从表中选取的字段,但类似于 COUNT 等 SQL 查询操作无法在图上体现,最好还是看实际 SQL 语句。
Note: SQLite 当中视图都是只读的,也就是说不能对视图进行插入、更新、删除等操作。但是可以在视图建立
触发器
触发器是为了维护数据库删除操作而建立的,因为所删除的表可能与另外的表有关系,需要同时删除另外一个表的字段。可以看以下一个例子:
1 | CREATE TRIGGER audio_meta_cleanup |
2 | DELETE ON audio_meta |
3 | BEGIN |
4 | DELETE FROM audio_genres_map WHERE audio_id = old._id; |
5 | DELETE FROM audio_playlists_map WHERE audio_id = old._id; |
6 | END ; |
这是关于 audio_meta 表的触发器,意思是当删除此表上的记录时,同时删除 audio_genres_map 表上 audio_id 与此表 id 相同的记录,删除 audio_playlists_map 表上 audio_id 与此表 id 相同的记录。这样当删除 audio_meta 表的记录时,另外两个表的相应记录也会自动删除,不会由于漏删除而残留多余数据。
3. 如何维护数据库
插入
插入、更新主要由 MediaScanner 进行,当删除/移动媒体文件时 MediaScanner 会扫描磁盘并更新数据库。数据插入主要在 endFile() 方法中进行,例如插入音频记录时相关的表都会插入相应的记录。而图片、视频缩略图,专辑封面这几个则是第一次取图片的时候才会生成缩略图保存到磁盘,并把记录插入到数据库中。
删除
删除操作主要由触发器维护。例如当一个应用删除图片时,一般只会删除图片数据库,所以必须要有触发器同时删除缩略图数据库。
删除操作主要由触发器维护。例如当一个应用删除图片时,一般只会删除图片数据库,所以必须要有触发器同时删除缩略图数据库。