Android MediaProvider数据库模式

最新推荐文章于 2024-06-22 00:30:00 发布

战斗鸡排

最新推荐文章于 2024-06-22 00:30:00 发布

阅读量900

点赞数

From: http://my.oschina.net/Failure/blog/53203

1. 如何提取数据库

以 root 权限进入 adb shell，使用 sqlite3 打开位于手机上 /data/data/com.android.providers.media/databases上的一个数据库。以 external 开头的数据库存储的是 SD 卡媒体信息，一张卡对应一个，所以如果手机使用过多张卡会有多个数据库。以 internal 开头的数据库存储手机内部存储器的媒体信息。因为一般用户无法访问手机内部存储器，而且这两个数据库结构是大体上是相同的，所以只需要关注 external 数据库即可。

2. 数据库模式分析

图片数据库

图片数据库由两个表组成，分别是 images 和 thumbnails，物理数据模型如下所示（Power Designer 逆向工程生成）

Note: 如何数据库物理模型图：<pk> 表示此为主键。其余的表名、字段名、数据类型应该都能看明白。

Note: SQLite 从 3.6.19 版才开始支持外键约束，Android 2.3.3 使用的是 3.7.x，但并没有使用此特性，而是通过操作数据库的程序（如 MediaScanner）以及触发器来维护数据库的一致性。这里可以了解 SQLite 的外键支持情况

数据表字段解析如下：

images：图片信息

字段	解析
_id	主键。图片 id，从 1 开始自增
_data	图片绝对路径
_size	文件大小，单位为 byte
_display_name	文件名
mime_type	类似于 image/jpeg 的 MIME 类型
title	不带扩展名的文件名
date_added	添加到数据库的时间，单位秒
date_modified	文件最后修改时间，单位秒
description
picasa_id	用于 picasa 网络相册
isprivate
latitude	纬度，需要照片有 GPS 信息
longitude	经度，需要照片有 GPS 信息
datetaken	取自 EXIF 照片拍摄时间，若为空则等于文件修改时间，单位毫秒
orientation	取自 EXIF 旋转角度，在图库旋转图片也会改变此值
mini_thumb_magic	取小缩略图时生成的一个随机数，见 MediaThumbRequest
bucket_id	等于 path.toLowerCase.hashCode()，见 MediaProvider.computeBucketValues()
bucket_display_name	直接包含图片的文件夹就是该图片的 bucket，就是文件夹名

thumbnails：缩略图

字段	解析
_id	主键。缩略图 id，从 1 开始自增
_data	图片绝对路径
image_id	缩略图所对应图片的 id，依赖于 images 表 _id 字段，可建立外键
kind	缩略图类型，1 是大缩略图，2 基本不用，3 是微型缩略图但其信息不保存在数据库
width	缩略图宽度
height	缩略图高度

视频数据库

数据表字段解析如下：

video：视频信息

字段	解析
_id	主键。视频 id
_data	视频绝对路径
_display_name	文件名
_size	文件大小，单位为 byte
mime_type	类似于 video/avi 的 MIME 类型
date_added	添加到数据库的时间，单位秒
date_modified	文件最后修改时间，单位秒
title	不带扩展名的文件名
duration	视频时长，单位毫秒
artist	艺术家
album	专辑名，一般为文件夹名
resolution
description
isprivate
tags
category
language
mini_thumb_data
latitude
longitude
datetaken
mini_thumb_magic	取小缩略图时生成的一个随机数，见 MediaThumbRequest
bucket_id	等于 path.toLowerCase.hashCode()，见 MediaProvider.computeBucketValues()
bucket_display_name	直接包含视频的文件夹就是该图片的 bucket，就是文件夹名
bookmark

videothumbnails：视频缩略图

字段	解析
_id	主键。缩略图 id
_data	缩略图绝对路径
video_id	缩略图所对应视频的 id，依赖于 video 表 _id 字段
kind	缩略图类型，1 是大图，视频只能取类型 1
width	缩略图宽度
height	缩略图高度

音频数据库

音频数据库是最复杂的，由 10 个表组成。物理数据模型如下所示：

album_art：专辑封面

字段	解析
album_id	主键。专辑 id
_data	专辑封面缓存的路径

albums：专辑信息

字段	解析
album_id	主键。专辑 id
album_key	全大写字母，用于字母索引
album	专辑名

android_metadata：当前字符编码

字段	解析
locale	默认字符编码，例如 zh_CN

artists：艺术家

字段	解析
artist_id	主键。艺术家 id
artist_key	全大写字母，用于字母索引
artist	艺术家

audio_genres：流派

字段	解析
_id	主键。流派 id
name	流派名称

audio_genres_map：音频流派映射

字段	解析
_id	主键。映射 id
audio_id	音频 id
genre_id	流派 id

Note: 为何要建立映射表：为了消除数据冗余。假如有大量音频属于同一流派，如果没有映射表则需要每个音频都需要记录同样的流派数据，有了映射表之后则只有一条记录就够了。这符合数据库设计的第三范式（the 3rd normal form）

audio_meta：音频信息

字段	解析
_id	主键。音频 id
_data	文件绝对路径
_display_name	文件名
_size	文件大小，单位 byte
mime_type	类似于 audio/mpeg 的 MIME 类型
date_added	添加到数据库的时间，单位秒
date_modified	文件最后修改时间，单位秒
title	来自 ID3 信息的标题，无则为不带扩展名的文件名
title_key	全大写字母的标题
duration	时长
artist_id	艺术家 id
composer	来自 ID3 信息，作曲家
album_id	专辑 id
track	来自 ID3 信息，音轨
year	来自 ID3 信息，年代
is_ringtone	是否铃声，0 或 1
is_music	是否音乐，1 才会在音乐播放器显示
is_alarm	是否闹钟铃声
is_notification	是否通知铃声
is_podcast	是否 podcast
bookmark

audio_playlists：播放列表

字段	解析
_id	主键。播放列表 id
_data
name	播放列表名
date_added
date_modified

audio_playlists_map：音频播放列表映射

字段	解析
_id	主键。映射 id
audio_id	音频 id
playlist_id	播放列表 id
play_order	播放顺序

索引

在 Android 数据库当中基本上使用自增 id 值作为主键，并建立了索引。索引可以加快数据查找速度，但由于需要维护索引所以插入/删除等写入操作速度会变慢。索引如下：

 
      CREATE  INDEX  album_id_idx on  audio_meta(album_id); 
 
CREATE  INDEX  album_idx on  albums(album); 
 
CREATE  INDEX  albumkey_index on  albums(album_key); 
 
CREATE  INDEX  artist_id_idx on  audio_meta(artist_id); 
 
CREATE  INDEX  artist_idx on  artists(artist); 
 
CREATE  INDEX  artistkey_index on  artists(artist_key); 
 
CREATE  INDEX  image_bucket_index ON  images(bucket_id, datetaken); 
 
CREATE  INDEX  image_id_index on  thumbnails(image_id); 
 
CREATE  INDEX  sort_index on  images(datetaken ASC, _id ASC); 
 
CREATE  INDEX  title_idx on  audio_meta(title); 
 
CREATE  INDEX  titlekey_index on  audio_meta(title_key); 
 
CREATE  INDEX  video_bucket_index ON  video(bucket_id, datetaken); 
 
CREATE  INDEX  video_id_index on  videothumbnails(video_id);

 
CREATE  INDEX  album_id_idx on  audio_meta(album_id); 
 
CREATE  INDEX  album_idx on  albums(album); 
 
CREATE  INDEX  albumkey_index on  albums(album_key); 
 
CREATE  INDEX  artist_id_idx on  audio_meta(artist_id); 
 
CREATE  INDEX  artist_idx on  artists(artist); 
 
CREATE  INDEX  artistkey_index on  artists(artist_key); 
 
CREATE  INDEX  image_bucket_index ON  images(bucket_id, datetaken); 
 
CREATE  INDEX  image_id_index on  thumbnails(image_id); 
 
CREATE  INDEX  sort_index on  images(datetaken ASC, _id ASC); 
 
CREATE  INDEX  title_idx on  audio_meta(title); 
 
CREATE  INDEX  titlekey_index on  audio_meta(title_key); 
 
CREATE  INDEX  video_bucket_index ON  video(bucket_id, datetaken); 
 
CREATE  INDEX  video_id_index on  videothumbnails(video_id);

由于比较简单就不解释了，要深入了解索引可以参考这个关于 SQL Server 的分析MySQL索引背后的数据结构及算法原理，原理应该是差不多的。

视图

视图类似于表，但并非独立存在，是从其他表里面查询数据得到的。使用视图可以加快数据库查询速度，不用每次都执行复杂的 SQL 语句查询。图如下所示：

Note: 如何看视图：图下面的部分是数据来源的表，中间是从表中选取的字段，但类似于 COUNT 等 SQL 查询操作无法在图上体现，最好还是看实际 SQL 语句。

Note: SQLite 当中视图都是只读的，也就是说不能对视图进行插入、更新、删除等操作。但是可以在视图建立 INSTEAD OF 触发器来达到同样的目的，多媒体数据库当中的 audio_delete 触发器就是如此。

触发器

触发器是为了维护数据库删除操作而建立的，因为所删除的表可能与另外的表有关系，需要同时删除另外一个表的字段。可以看以下一个例子：

 
      CREATE  TRIGGER  audio_meta_cleanup 
 
DELETE  ON  audio_meta 
 
BEGIN
 
    DELETE  FROM  audio_genres_map WHERE  audio_id = old._id; 
 
    DELETE  FROM  audio_playlists_map WHERE  audio_id = old._id; 
 
END;
 
CREATE  TRIGGER  audio_meta_cleanup 
 
DELETE  ON  audio_meta 
 
BEGIN
 
    DELETE  FROM  audio_genres_map WHERE  audio_id = old._id; 
 
    DELETE  FROM  audio_playlists_map WHERE  audio_id = old._id; 
 
END;

这是关于 audio_meta 表的触发器，意思是当删除此表上的记录时，同时删除 audio_genres_map 表上 audio_id 与此表 id 相同的记录，删除 audio_playlists_map 表上 audio_id 与此表 id 相同的记录。这样当删除 audio_meta 表的记录时，另外两个表的相应记录也会自动删除，不会由于漏删除而残留多余数据。

3. 如何维护数据库

插入

插入、更新主要由 MediaScanner 进行，当删除/移动媒体文件时 MediaScanner 会扫描磁盘并更新数据库。数据插入主要在 endFile() 方法中进行，例如插入音频记录时相关的表都会插入相应的记录。而图片、视频缩略图，专辑封面这几个则是第一次取图片的时候才会生成缩略图保存到磁盘，并把记录插入到数据库中。

删除

删除操作主要由触发器维护。例如当一个应用删除图片时，一般只会删除图片数据库，所以必须要有触发器同时删除缩略图数据库。

SQLite3 命令行操作指南

.help
查看帮助信息

.backup ?DB? FILE
备份数据库, 方法:.backup [main|...] filename, 数据库名可以通过.databases 命令得到,一般为main, 可以省略, filename为磁盘文件名.

.bail ON|OFF
遇到错误时不再继续, 默认为OFF

.databases
列出附加到数据库的数据库和文件

.dump ?TABLE? ...
保存表到SQL格式的文件中, 没有指定表名, 则保存所有. 如果要保存到磁盘上需要结合 .output 命令.

.echo ON|OFF
打开/关闭命令行回显

.exit
退出该命令行

.explain ?ON|OFF?
以合适的方式显示表头, 不带参数则为开启

.header<s> ON;OFF
是否显示表头, 和 .explain 差别不是很大

.help
显示帮助信息

.import FILE TABLE
从文件中导入表

.indices ?TABLE?
显示索引

.load FILE ?ENTRY?
加载一个扩展库

.log FILE|off
是否记录日志,文件可以是标准输出/输入

.mode MODE ?TABLE?
设置输出模式, 模式可以是以下几种:
    csv        以逗号分隔的值
    column    表头左对齐(参见 .width)
    html    显示 HTML 代码
    insert    SQL插入语句
    line    一行一个值
    list    值用 string 分隔
    tabs    以 tab 分隔的值
    tcl        TCL 列表元素

.nullvalue STRING
以 STRING 代替 NULL 值的输出

.output FILENAME
输出到文件, 而不是显示在屏幕上

.output stdout
输出到屏幕上

.prompt MAIN CONTINUE
替换默认的命令提示信息, 默认就是 sqlite>

.quit
退出命令行

.read FILENAME
执行 FILENAME 中的 SQL

.restore ?DB? FILE
从文件中还原数据到表, 默认表为 main

.schema ?TABLE?
显示 CREATE 语句

.timeout MS
在 MS 时间内尝试打开被锁定的表

.vfsname ?AUX?
显示 VFS 栈信息

.width NUM1 NUM2 ...
设置 column 模式中的列的宽度

.timer ON|OFF
显示CPU时间