AIGC数据三大隐患,企业该如何规避风险?
发布时间:2023-08-27 来源:华然咨询
随着人工智能技术的不断演进, AIGC正日益成为信息生产的主要方式之一。然而,与其崭新的产业前景相伴的是AIGC合规问题的迫切性与严重性,这是每一个从业者都应认真思考的命题。
一、数据隐私泄露,第一隐患
在普通用户或个体中,隐私和信息安全意识尚未充分觉醒。但对于涉及高度保密性的行业,例如金融机构等,数据泄露的风险极高。以ChatGPT为例,用户所输入的各类信息将经由美国服务器传输,再返回用户端。然而这个过程中,用户数据已经不经意地跨境流出。
“确保用户及相关方的信息安全,遵循隐私保护法,不向模型输入个人信息。训练数据集需要经过合规清洗和数据处理,并留存相关记录日志。”
二、数据来源合法性,三方合作要注意
在“酷米客诉车来不正当竞争纠纷案”中,法院认为,未经权利人许可,利用网络爬虫技术进入权利人的服务器后台的方式非法获取并无偿使用权利人的实时公交信息数据的行为,实为一种“不劳而获”、“食人而肥”的行为,且具有非法占用他人无形财产权益,破坏他人市场竞争优势,构成不正当竞争。
“合规需要前置审核开源数据源和与第三方的合作协议,避免与第三方合作权责不清导致的合规法律风险;同时,要遵循三方协议约束,动态更新合规策略。”
三、数据质量不容忽视,严格把关。
暂行办法对数据标识和数据质量都提出了要求,如果训练和微调没有做好质量把控,那么输出内容亦无法保障。在部署和训练过程,都需要做好一套数据标注规则,对操作者实施安全培训。
随着法规的逐步完善,企业在数据隐私、信息真实性和数据获取途径等方面都将迎来更高的合规要求。下一篇,将重点讲讲,内容合规。
华然咨询于2022年组建AI技术服务团队,为企业客户提供AI转型整体解决方案。