来自🥬🐶程序员 Truraly | 田园 的博客,最新文章首发于:田园幻想乡 | 原文链接 | github (欢迎关注)
参考资料:数据挖掘:(一)数据获取 | 博客园
数据获取的方式:
- 使用数据获取技术(如爬虫)发现,扩充或者生成数据
- 使用多种标记技术标记单个数据
- 改进现有数据质量或者改进已经训练好的模型
数据获取:
- 数据采集
- 数据发现
- 共享
- 检索
- 数据增强
- 推导潜在语义
- 实体增强
- 数据集成
- 数据生成
- 众包
- 数据合成
- 一般化
- 特定场景
- 数据发现
- 数据标签
- 无标签
- 人工标注
- 众包
- 主动学习
- 弱标注
- 数据编程
- 实体抽取
- 人工标注
- 比分标签
- 半监督学习
- 无标签
- 现有数据
- 数据提升
- 数据清洗
- 重标注
- 模型提升
- 提升模型性能
- 模型蒸馏
- 数据提升
————————————————
版权声明:本文为 田园幻想乡 的原创文章,遵循 CC 4.0 BY-NA-SA 版权协议,转载请附上原文出处链接及本声明。
原文链接:http://truraly.fun/课程笔记/数据挖掘/【2】数据获取.html