生成人工智能 (AI)在许多行业和学科中有着巨大的前景。然而,与任何强大的新技术一样,它也带来了新的安全风险。让我们花点时间深入了解新兴的生成性人工智能威胁形势,特别关注数据和系统安全领域。这篇博文还将重点介绍组织如何安全地采用这些工具,即使存在这些风险。
生成式人工智能有何不同?
要了解生成式人工智能如何改变威胁形势,我们必须首先考虑这些新系统与过去 50 年来作为供应链系统支柱的传统系统有何不同。五大差异如下:
- 与数据库已有的技术相比,生成人工智能的安全工具和实践仍在不断成熟。经过数十年的关注,SQL 注入等数据库安全漏洞已被充分了解。开发人员接受了针对这些威胁的广泛培训,并且强大的审计工具已集成到 CI/CD 管道中。然而,生成式人工智能之旅才刚刚开始,威胁建模和工具仍在不断涌现。
- 生成式人工智能提供新颖的见解,而不仅仅是检索记录。虽然数据库返回的是它们之前存储的数据(可能经过了转换或计算),但生成式人工智能会根据其训练合成新的数据。这类似于分析师产生见解而职员获取记录。
- 形式化的编程语言是可预测且明确的,不像生成式人工智能所使用的自然语言中存在的细微差别和模糊性。数据库使用形式语言(例如 SQL),它利用形式化、可理解的语法来访问数据。在已存储的数据上下文中,给定的 SQL 语句将始终产生相同的结果。然而,生成式人工智能利用自然的“日常”语言(包括其所有的细微差别和模糊性)进行所有输入和输出。就像两个人协商合同一样,人类和人工智能应用程序之间可能会出现误解。此外,生成式人工智能的输出是不确定的——这意味着相同的输入在措辞、文字或含义上可能会产生不同的结果。
- 与控制更严格的数据库相比,生成式人工智能可能缺乏可追溯性和审计能力。通过数据库,授权用户可以轻松审核存储的数据并追踪其来源。相比之下,生成式人工智能模型将知识以大多数人无法理解的形式存储在神经网络中。此外,目前还没有强大的技术来审核生成式人工智能模型所获得的“知识”,或其训练数据中的潜在偏差。
- 目前,生成式人工智能的内置数据访问控制比数据库要少。数据库具有强大的授权控制来管理数据访问。然而,生成人工智能目前缺乏这种内置控制。经过身份验证的用户可以访问任何数据。
研究传统系统和生成式人工智能之间的差异可以揭示新的安全漏洞和必要的缓解措施,这些漏洞和缓解措施可分为三个关键领域:保护敏感数据、保护系统和数据免遭恶意使用以及正确管理人工智能代理和插件。