防堵AI语音诈骗! 台科大学生开发APP辨识真伪 守护声音使用权
近年来深度伪造(Deep Fake)技术迅速发展,有不法分子利用 AI 语音合成技术进行语音诈财,对社会造成重大隐患。针对这一问题,国立台湾科技大学资讯管理系学生王玟雅、蔡婷 、陈俞 及毛世鑫共同开发「应用音讯浮水印於对抗式攻击与深度学习之数位护声符系统」,提供语音防护与真伪辨识。他们设计的「护声符 APP」在第29届大专院校资讯应用服务创新竞赛中也荣获资安应用组第二名及资讯应用组第三名的佳绩。
王玟雅表示,亲友曾经接过陌生来电,被诱导进行对话的经历,再加上看到关於语音诈骗的新闻,让她萌生设计语音防护系统的想法,希望以科技手段保障声音权益。「护声符APP」具备语音真伪辨别及数位音讯防护两大功能,除了可以分辨语音是AI还是真人,还能为声音加上特殊的「音讯浮水印」,也就是人类听不见的音频或标记,防止声音被AI软体进行二次合成利用,音讯浮水印也能作为保障声音版权的依据。
在语音真伪辨识方面,团队搜集公开的真人语音资料库与AI合成音讯,利用侦测模型整合与分类,分析真实语音与合成语音的特徵与差异,最终训练出辨识系统。在背景音乾净的情况下,该系统对真人语音的辨识准确率高达99.99%,对AI合成音的辨识准确率则为99.94%。王玟雅表示,此次团队的共同合作开发也在软硬实力上带给她比预期中更多的成长与收获。
目前APP支援音档上传与录制功能,使用者可藉此辨别语音真伪或添加浮水印。王玟雅也将规划完整开发即时通话中的语音辨识与防护功能。同时,因为目前训练模型用的语音资料大多为英文,团队也预计扩展模型的语音数据库,搜集更多中文语音样本进行模型训练,增强对中文语音的支持,以符合台湾民众的使用需求。未来,希望可以将「护声符APP」发展成合规性工具,应用於通信、声音版权保障、生物特徵验证、影视制作等领域,成为具有公信力、保障声音版权的工具。
团队成员毛世鑫分享,尽管他原本对语音相关的资安技术不熟悉,但为了完成语音模型的开发,他也特意去进修相关课程,拓展知识层面。来自印尼的成员陈俞 一开始对於得奖并没有抱太大的期待,听到获奖的消息时,她感到相当惊喜,「得奖对我来说是一种鼓励,让我更坚定想要朝资安的领域继续努力。」成员蔡婷 也说,竞赛得奖让她更有动力去面对未来的各种挑战,能更有信心迎难而上。
指导老师黄政嘉助理教授指出,声音权益在近年逐渐受到重视。例如,公众人物的声音可能被不法分子利用,制作出虚假言论,严重影响其声誉;日本甚至有声优因声音遭窃取而影响工作权,但目前声音版权保障相关法规仍不完善。
黄政嘉也提到,「护声符APP」使用的技术具有高度市场需求,但开发具公信力的系统面临诸多挑战,包括语音样本的搜集与模型建构等。黄政嘉透过引导的方式,鼓励学生从日常生活中发掘问题与解决方案,保持创造力与热忱,逐步实现构想,成为业界亟需的专业即战人才。
图说:台科大资管系学生王玟雅、蔡婷 、陈俞 及毛世鑫开发「应用音讯浮水印於对抗式攻击与深度学习之数位护声符系统」,荣获第29届大专院校资讯应用服务创新竞赛资安应用组第二名及资讯应用组第三名。
王玟雅表示,亲友曾经接过陌生来电,被诱导进行对话的经历,再加上看到关於语音诈骗的新闻,让她萌生设计语音防护系统的想法,希望以科技手段保障声音权益。「护声符APP」具备语音真伪辨别及数位音讯防护两大功能,除了可以分辨语音是AI还是真人,还能为声音加上特殊的「音讯浮水印」,也就是人类听不见的音频或标记,防止声音被AI软体进行二次合成利用,音讯浮水印也能作为保障声音版权的依据。
在语音真伪辨识方面,团队搜集公开的真人语音资料库与AI合成音讯,利用侦测模型整合与分类,分析真实语音与合成语音的特徵与差异,最终训练出辨识系统。在背景音乾净的情况下,该系统对真人语音的辨识准确率高达99.99%,对AI合成音的辨识准确率则为99.94%。王玟雅表示,此次团队的共同合作开发也在软硬实力上带给她比预期中更多的成长与收获。
目前APP支援音档上传与录制功能,使用者可藉此辨别语音真伪或添加浮水印。王玟雅也将规划完整开发即时通话中的语音辨识与防护功能。同时,因为目前训练模型用的语音资料大多为英文,团队也预计扩展模型的语音数据库,搜集更多中文语音样本进行模型训练,增强对中文语音的支持,以符合台湾民众的使用需求。未来,希望可以将「护声符APP」发展成合规性工具,应用於通信、声音版权保障、生物特徵验证、影视制作等领域,成为具有公信力、保障声音版权的工具。
团队成员毛世鑫分享,尽管他原本对语音相关的资安技术不熟悉,但为了完成语音模型的开发,他也特意去进修相关课程,拓展知识层面。来自印尼的成员陈俞 一开始对於得奖并没有抱太大的期待,听到获奖的消息时,她感到相当惊喜,「得奖对我来说是一种鼓励,让我更坚定想要朝资安的领域继续努力。」成员蔡婷 也说,竞赛得奖让她更有动力去面对未来的各种挑战,能更有信心迎难而上。
指导老师黄政嘉助理教授指出,声音权益在近年逐渐受到重视。例如,公众人物的声音可能被不法分子利用,制作出虚假言论,严重影响其声誉;日本甚至有声优因声音遭窃取而影响工作权,但目前声音版权保障相关法规仍不完善。
黄政嘉也提到,「护声符APP」使用的技术具有高度市场需求,但开发具公信力的系统面临诸多挑战,包括语音样本的搜集与模型建构等。黄政嘉透过引导的方式,鼓励学生从日常生活中发掘问题与解决方案,保持创造力与热忱,逐步实现构想,成为业界亟需的专业即战人才。
图说:台科大资管系学生王玟雅、蔡婷 、陈俞 及毛世鑫开发「应用音讯浮水印於对抗式攻击与深度学习之数位护声符系统」,荣获第29届大专院校资讯应用服务创新竞赛资安应用组第二名及资讯应用组第三名。