Mondrian 项目使用教程
1. 项目目录结构及介绍
Mondrian/
├── data/
│ └── ...
├── utils/
│ └── ...
├── .gitignore
├── .travis.yml
├── LICENSE
├── README.md
├── anonymizer.py
├── mondrian.py
└── mondrian_test.py
- data/: 存放数据文件的目录。
- utils/: 存放工具类和辅助函数的目录。
- .gitignore: Git 忽略文件配置。
- .travis.yml: Travis CI 配置文件。
- LICENSE: 项目许可证文件。
- README.md: 项目说明文档。
- anonymizer.py: 项目的主要启动文件,用于执行数据匿名化操作。
- mondrian.py: Mondrian 算法的实现文件。
- mondrian_test.py: Mondrian 算法的测试文件。
2. 项目启动文件介绍
anonymizer.py
anonymizer.py
是项目的主要启动文件,用于执行数据匿名化操作。可以通过命令行参数来配置不同的运行模式和数据集。
使用示例
# 运行默认配置的 Mondrian 算法
python anonymizer.py
# 运行严格模式的 Mondrian 算法,使用 adult 数据集,K=20
python anonymizer.py s a 20
# 运行放松模式的 Mondrian 算法,使用 INFORMS 数据集,K=11
python anonymizer.py r i 11
参数说明
r
: 放松模式(Relaxed Mondrian)s
: 严格模式(Strict Mondrian)a
: 使用 adult 数据集i
: 使用 INFORMS 数据集k
: 指定 K 值qi
: 指定 QI(Quasi-Identifiers)数量data
: 指定数据集大小
3. 项目配置文件介绍
.travis.yml
.travis.yml
是 Travis CI 的配置文件,用于自动化测试和持续集成。该文件定义了项目的构建和测试流程。
配置示例
language: python
python:
- "3.6"
- "2.7"
install:
- pip install -r requirements.txt
script:
- python mondrian_test.py
.gitignore
.gitignore
文件用于指定 Git 忽略的文件和目录,避免将不必要的文件提交到版本库中。
配置示例
# 忽略所有 .pyc 文件
*.pyc
# 忽略所有 .log 文件
*.log
# 忽略 data 目录
/data/
LICENSE
LICENSE
文件包含了项目的开源许可证信息,通常为 MIT 许可证。
README.md
README.md
文件是项目的说明文档,包含了项目的简介、安装方法、使用说明等内容。
内容示例
# Mondrian
Mondrian 是一个用于多维 K-匿名化的 Python 实现。
## 安装
```bash
git clone https://github.com/qiyuangong/Mondrian.git
cd Mondrian
pip install -r requirements.txt
使用
python anonymizer.py
许可证
本项目采用 MIT 许可证。
通过以上内容,您可以了解并使用 Mondrian 项目进行数据匿名化操作。