谷歌开源其用于AI生成文本的水印工具

作者：Yu 来源：原创 2024-10-25

10月25日消息，谷歌宣布，该公司创建的SynthID文本水印技术现已通过Google Responsible Generative AI Toolkit以开源形式提供。该工具旨在使AI生成的文本更容易被识别。

谷歌DeepMind的研究副总裁Pushmeet Kohli在接受媒体采访时表示：“现在，其他生成式AI开发者将能够使用这项技术帮助他们检测文本输出是否来自他们自己的大模型，使得更多开发人员能够负责任地构建AI。”

随着大模型被用于传播误导信息，以及其他恶意目的，水印已成为越来越重要的工具。然而，这些工具仍在不断完善中。

SynthID于去年八月宣布，通过在生成图像、音频、视频和文本时加入一个不可见的水印，帮助使AI生成的输出变得可检测。谷歌表示，文本版本的SynthID通过以一种软件可以检测但人类无法察觉的方式略微降低文本输出的概率来实现：

一个大模型一次生成一个标记。这些标记可以代表单个字符、单词或短语的一部分。为了创建连贯的文本序列，模型预测下一个最可能生成的标记。这些预测基于前面的单词和分配给每个潜在标记的概率分数。

例如，对于短语“我最喜欢的热带水果是__。” 大模型可能会开始用“芒果”、“荔枝”、“木瓜”或“榴莲”等标记完成句子，并且每个标记都被赋予了一个概率分数。当有一系列不同的标记可供选择时，SynthID可以在不损害输出的质量、准确性和创造性的情况下调整每个预测标记的概率分数。

这个过程在整个生成的文本中重复进行，因此一个句子可能包含十个或更多的调整后的概率分数，而一页可能包含数百个。模型的单词选择结合调整后的概率分数的最终模式被视为水印。

谷歌声称，该系统已经集成到其Gemini聊天机器人中，不会损害生成文本的质量、准确性、创造性或速度，这一直是水印系统的长期问题。谷歌表示，它可以处理短至三句话的文本，以及被裁剪、改写或修改过的文本。但它在处理简短文本、被重写或翻译的内容，甚至是对事实问题的回应时遇到了困难。

谷歌在五月份的一篇博客文章中写道：“SynthID不是识别AI生成内容的万能解决方案。但是它是开发更可靠的AI识别工具的重要组成部分，可以帮助数百万人就他们如何与AI生成的内容互动做出明智的决定。”

企业俱乐部