以下是近三年(2021-2024年)在文本、音频和视频素材检索领域的技术:
文本素材检索技术
技术名称 | 出现时间 | 支持离线部署 | 支持微调 | 支持中文处理 | 运行所需配置参数 | 价格信息 | 备注 |
---|---|---|---|---|---|---|---|
GPT-4 | 2023年 | 否 | 否 | 是 | GPU(NVIDIA A100 及以上)、内存64GB、存储空间200GB+ | API收费,按使用量计费,通常较高 | 高级文本生成与理解模型 |
GPT-3 | 2020年 | 否 | 否 | 是 | GPU(NVIDIA A100 及以上)、内存64GB、存储空间200GB+ | API收费,按使用量计费,通常较高 | 前一代高级文本生成模型 |
BERTology | 2021年 | 是 | 是 | 是 | GPU(NVIDIA RTX 2080 Ti 及以上)、内存32GB、存储空间50GB+ | 开源工具,费用为硬件成本 | BERT的进一步优化与应用 |
DistilBERT | 2022年 | 是 | 是 | 是 | GPU(NVIDIA GTX 1080 Ti 及以上)、内存16GB、存储空间20GB+ | 开源工具,费用为硬件成本 | 精简版的BERT,性能更高效 |
T5 | 2022年 | 是 | 是 | 是 | GPU(NVIDIA RTX 2080 Ti 及以上)、内存32GB、存储空间50GB+ | 开源工具,费用为硬件成本 | 转换器模型,支持多种文本生成任务 |
RoBERTa | 2022年 | 是 | 是 | 是 | GPU(NVIDIA RTX 2080 Ti 及以上)、内存32GB、存储空间50GB+ | 开源工具,费用为硬件成本 | BERT的改进版本,性能更佳 |
XLNet | 2021年 | 是 | 是 | 是 | GPU(NVIDIA RTX 2080 Ti 及以上)、内存32GB、存储空间50GB+ | 开源工具,费用为硬件成本 | 提供更好的上下文理解能力 |
ELECTRA | 2021年 | 是 | 是 | 是 | GPU(NVIDIA RTX 2080 Ti 及以上)、内存32GB、存储空间50GB+ | 开源工具,费用为硬件成本 | 更高效的预训练文本生成模型 |
ALBERT | 2021年 | 是 | 是 | 是 | GPU(NVIDIA RTX 2080 Ti 及以上)、内存32GB、存储空间50GB+ | 开源工具,费用为硬件成本 | 更小、更快的BERT变种 |
Pegasus | 2021年 | 是 | 是 | 是 | GPU(NVIDIA RTX 2080 Ti 及以上)、内存32GB、存储空间50GB+ | 开源工具,费用为硬件成本 | 生成摘要的预训练模型 |
CTRL | 2021年 |