深度学习框架下的版权保护和叛逃者追踪
人类的指纹与生俱来,世界上没有两枚完全一样的指纹,因此它也成为刑事案件侦查中的重要依据。然而,你可曾想过人工智能也可以具有“指纹”么?网络空间安全研究院2017级博士研究生徐国文就把这个设想变为了现实。他在深度学习模型中嵌入“密码指纹”,为追踪贩卖盗版人工智能模型的行为提供了可能。
就在最近,徐国文凭借《深度学习框架下的版权保护和叛逃者追踪》一文,荣获第26届国际并行和分布式系统会议(ICPADS2020)的“最佳论文奖”。这是电子科技大学在该会议首次获奖。
徐国文的研究生生活是充实的,他是大家眼中的“科研大佬、拿奖狂人”。在五年的研究生生涯中,徐国文发表了近30篇学术论文,连续三年获得研究生国家奖学金,各类奖学金金额累计超过20万元。
“我觉得自己还远远谈不上成功,我唯一突出的地方就是兴趣和执着。” 回头来路,徐国文道出了他在科研道路上乘风破浪的“秘籍”。
寻找被盗模型,密码“指纹”显神通
如今,人工智能已经浸入到了我们生活的方方面面,可以帮助我们做很多事情,如图像识别、语音转写、安防监控等等。要想让人工智能变得像人类一样聪明,需要不断地“学习训练”,这样的学习“材料”就是数据集。研究者们通过收集和标注大量的数据,编写人工智能的“学习材料”,训练好人工智能的模型。最后,模型的所有者提供了查询的接口,使人们仅需付出少量的费用,就能享受到人工智能提供的特定服务,方便了我们的生活。
但是,这样公开的查询,也给了一些不法之徒可乘之机,虽然不能直接接触到模型,但是他们绞劲脑汁,设计样本对原始模型进行查询,用最少的查询次数来获得大量的模型信息,并炮制出“伪造”的模型从中获利。这样的行为不尊重模型所有者的劳动成果,并且严重损害了原创者的利益。
如何追踪这样的叛逃者呢?徐国文提出了一种新方法:将要购买模型服务的买家信息,通过密码学中的“编码”技术,在模型训练的时候嵌入到模型中去。和人类的独一无二的“指纹”一样,徐国文提出的方法,能给每个买家量身定做一个“密码指纹”,并把这串“二进制”的指纹嵌入到模型的部分参数中。当发生模型的盗版情况,通过提取出模型的“密码指纹”就能找到叛逃者是谁。
可能有人会想,既然“指纹”只在模型的少量参数中,那么通过和其他买家串通,各自去掉这些带有“指纹”的参数,并把模型拼接在一起,是不是就能获得没有“指纹”的模型呢?“这种情况是不可能出现的。”徐国文笑着说。“如果他们相互串通,我们会从模型的数学分布中观察到一些独有的特征,反而能找到所有参与的买家。这就是我的方法在分布式环境中也能发挥出作用的原因。”
密码“指纹”是否可以消除掉呢?不会,徐国文介绍说,这是深度学习模型与别的模型的不同之处。模型通过不断的、反复的学习训练过程的巩固,早已将“指纹”深刻地记忆在了整个模型中。除非将模型内部参数大幅度改变,否则密码“指纹”是没法被擦除的。即使真的有人实现了“指纹”的抹除,但在那种情况下,模型基本就损坏了,不再具有使用的价值。
徐国文介绍道,自己提出的版权保护的方法有很多应用。除了在商业中对盗版的追踪之外,还可以对云盘中的数据进行加密保护等。除此之外,他在数据挖掘的安全、存储安全和加密、人工智能模型的使用和训练的过程隐私保护等方向也有深入的研究。“我们做的是基础工作,因为在大数据时代,安全是一切的前提。”徐国文说。
成长是个逐渐变“小”的过程
从2015年考入电子科大硕博连读算起,这已经是徐国文在网络空间安全领域进行科研探索的第五年了。他本科专业是数学,这为后来密码学的研究打下了坚实的基础,读研之后徐国文跟随导师李洪伟教授走上了信息安全的道路。“当时我对信息安全这个领域一点概念都没有,只想着攒足劲儿,考上研究生就行。后来我才逐渐认识到了这个领域对国家安全的重要战略意义和广阔的发展前景,就更加坚定了在网络空间安全领域深耕的决心。”徐国文说道。
在导师的指导和帮助下,徐国文在研一研二期间就发表了七篇论文,这让他产生了轻微的自负情绪。然而兵法有云,骄兵必败,徐国文意识到如果自己要在学术道路上再进一步,去国外开阔一下眼界十分必要。他争取到了国家留学基金委的支持,前往新加坡管理大学交流,这段经历让他的心态发生了巨大的转变。
“去了新加坡之后才发现人外有人天外有天,”徐国文回忆道,“我发现自己有的东西别人都有,而且他们每个人都有自己的特长,处在这样的环境中就觉得自己很普通。”徐国文认为,这种心理落差反而成为了他成长的动力。“这样的环境让我产生了很大的紧迫感,促使我不断的学习。”
徐国文说,在新加坡的时候,最敬佩的人是他的外导Robert Deng教授。“老师是个华人,是搞密码学研究的,也做一些图像方面的研究。《深度学习框架下的版权保护和叛逃者追踪》这篇论文的写作灵感就是偶然看到了Robert Deng教授图像方面的研究材料而诞生的。”
“写这篇论文的时候,正值新冠肺炎疫情全球暴发,当时我人在新加坡,那时学校也提供了很多的支持与帮助。”徐国文说。“学校联系了大使馆,给我们这些身在国外的学生提供了手套、口罩等等。导师也非常关心我,有学校和团队作为我坚强的后盾,我就只管专心做科研了。”
星光不负赶路人,时光不负有心人
当然,徐国文的科研之路也不是一帆风顺的,刚一开始,他就遇到了第一个拦路虎,英语。“我第一篇论文就是因为语言太糟糕而被拒稿。”收到审稿人“terrible”的评价的时候,徐国文并不气馁,暗自下决心一定要攻克语言关。
他用四个字“迎难而上”,总结了自己学习英语的经验。“学习一门语言不是一蹴而就的,它需要靠长期的积累。刚开始的时候我连语法都不怎么清楚,然后就买了一本语法书开始看,但是光看也不行,还要自己写,写完之后就找师兄师姐或学弟学妹帮忙看,这样才能知道自己哪里写错了或者有更好的表达,就是这样经过了无数次的练习之后我才写出了第一篇比较像样的论文。”
进入博士生阶段之后,徐国文又遇到了他的第二个挑战,即如何取舍。“刚读博的时候,我想代码和论文一起抓,但后来发现,如果想把一个方向做到极致,必须要舍弃掉一个东西。最终我选择集中精力在论文上面”。为了将自己的科研工作做得更好,徐国文坦言,读博的前两、三年基本都是早上8点到实验室,晚上12点回去,披星戴月是他的真实写照。
在徐国文的科研路上,妻子给了她很大的支持。“她每天都会为我做宵夜,不是短暂的一天、两天,而是长期的一年、两年。”谈到妻子,徐国文的脸上不自觉地露出了幸福而甜蜜的笑容,“后来我公派留学,她也非常支持我,她基本不会让我操心科研以外的事情,能够遇见她,我真的觉得非常幸运”。
回首自己的科研经历,徐国文认为,“我离成功还太远了,科研只是人生的一个方面。就科研来说,我也没有别人聪明,我唯一能够坚持做下去的原因是兴趣和执着。如果你想比别人更优秀,就必须付出比别人更多的努力。”
博士毕业后,徐国文将前往新加坡南洋理工做博后。谈到对未来的展望时,徐国文说,“未来还是将从事人工智能的安全运营、隐私方面的研究,希望学成回国做一个大学老师,教书育人”。
近十年的求学生涯,徐国文仍还是有遗憾。在本科的时候,他喜欢健身,喜欢唱歌,有时间也会练书法。后来学业科研太忙,这些兴趣爱好也都落下了。“如果能够时光倒流,我希望自己的大学生活能够更丰富一些。”对于学弟学妹们,徐国文建议,“在大学,不要一味地只追求GPA,在学有余力的条件下也要试着培养一些特长、爱好,参加一些社团,谈一场纯粹的恋爱,在最美好的年纪做一些自己真正热爱的事。”(文/电子科技大学)