Lightwood 开源项目教程

钱恺才Grace

于 2024-09-25 07:32:09 发布

阅读量440

点赞数 25

本文链接：https://blog.csdn.net/gitblog_00684/article/details/142505251

版权

Lightwood 开源项目教程

lightwood Lightwood is Legos for Machine Learning. 项目地址: https://gitcode.com/gh_mirrors/li/lightwood

1. 项目介绍

Lightwood 是一个 AutoML 框架，旨在通过 JSON-AI 语法生成和定制机器学习管道。其目标是简化数据科学/机器学习（DS/ML）生命周期，使用户能够专注于数据处理和模型构建的独特和定制部分，而无需编写重复的样板代码。Lightwood 支持多种数据类型，如数字、日期、类别、标签、文本、数组和各种多媒体格式，并支持时间序列模式。

2. 项目快速启动

安装 Lightwood

首先，确保你已经安装了 Python 3.8 或更高版本。然后，使用 pip 安装 Lightwood：

pip3 install lightwood

快速启动示例

以下是一个简单的示例，展示如何使用 Lightwood 进行机器学习任务：

import pandas as pd
from lightwood.api.high_level import (
    ProblemDefinition,
    json_ai_from_problem,
    code_from_json_ai,
    predictor_from_code,
)

if __name__ == '__main__':
    # 加载数据集
    df = pd.read_csv("https://raw.githubusercontent.com/mindsdb/benchmarks/main/benchmarks/datasets/hdi/data.csv")
    
    # 定义预测任务，指定目标列
    pdef = ProblemDefinition.from_dict({
        "target": "Development Index"  # 要预测的列
    })
    
    # 生成 JSON-AI 代码以建模问题
    json_ai = json_ai_from_problem(df, problem_definition=pdef)
    
    # 可选：查看生成的 JSON-AI 语法
    # print(json_ai.to_json())
    
    # 生成 Python 代码
    code = code_from_json_ai(json_ai)
    
    # 可选：查看生成的代码
    # print(code)
    
    # 从 Python 代码创建预测器
    predictor = predictor_from_code(code)
    
    # 从原始数据训练模型
    predictor.learn(df)
    
    # 进行预测
    test_df = predictor.split(predictor.preprocess(df))["test"]
    preds = predictor.predict(test_df.iloc[:10])
    print(preds)