第一章:为什么国产模型需要联邦学习?哪些行业必须搞这个
大模型落地的时候,有一个老生常谈但始终绕不开的问题:
你想调模型,数据不给你,咋整?
这个问题在很多行业特别明显,尤其是这些:
行业 | 数据敏感性 | 是否能随便上传云端? | 场景例子 |
---|---|---|---|
医疗 | 高度敏感 | ❌ 不行(涉及病人隐私) | 医院问诊记录、影像报告 |
政务 | 严格受控 | ❌ 不行(不能出内网) | 公文解析、办事流程问答 |
银行金融 | 商业保密 | ❌ 不行(涉及资金/客户) | 风控文档、客户对话记录 |
制造业 | 商业机密 | 一般不能 | 生产流程、设计参数说明 |
很多地方不是不想做模型微调,而是根本不能把数据给你用。即便你在公司内部做,也可能遇到“北京分公司不能把数据发给上海研发部”的情况。