谷歌直接把OpenAI家给偷了?还窃取到了gpt-3.5-turbo关键信息?
这几天又有条大新闻谷歌最新研究揭示出一种攻击大型语言模型的方法,成功窃取OpenAI GPT-3.5-turbo模型的关键信息
不仅还原整个OpenAI大模型的投影矩阵,还知道了确切的隐藏维度大小,最为关键的是成本非常低廉,低至150人名币
这种方法的核心攻击目标是模型的最后一层:嵌入投影层,负责将隐藏维度映射到logits向量通过API访问,甚至只需不到2000次巧妙查询就搞定了,这种方法同样适用于GPT-4
这次被狠狠将了一军#科技风向标#
不过幸好的是研究团队在提取模型最后一层参数之前,已征得OpenAI同意,攻击完成后,双方还确认了方法的有效性,最终删除所有与攻击相关的数据
OpenAI最终选择修改模型API,只要功夫深哪有紧锁的大门以后长点心吧
这几天又有条大新闻谷歌最新研究揭示出一种攻击大型语言模型的方法,成功窃取OpenAI GPT-3.5-turbo模型的关键信息
不仅还原整个OpenAI大模型的投影矩阵,还知道了确切的隐藏维度大小,最为关键的是成本非常低廉,低至150人名币
这种方法的核心攻击目标是模型的最后一层:嵌入投影层,负责将隐藏维度映射到logits向量通过API访问,甚至只需不到2000次巧妙查询就搞定了,这种方法同样适用于GPT-4
这次被狠狠将了一军#科技风向标#
不过幸好的是研究团队在提取模型最后一层参数之前,已征得OpenAI同意,攻击完成后,双方还确认了方法的有效性,最终删除所有与攻击相关的数据
OpenAI最终选择修改模型API,只要功夫深哪有紧锁的大门以后长点心吧