上传语音防伪模型

赛题三 · Deepfake 语音检测 · AI 合成语音识别

拖拽 .pt 文件到此处,或点击选择文件

仅支持 .pt / .pth 格式,最大 200MB

提交须知:

  • 提交 PyTorch 模型(torch.nn.Module),保存为 .pt 或 .pth 文件
  • 模型输入:Mel 频谱图张量 (B, 1, 80, T),16kHz 采样率,80-band mel
  • 模型输出:伪造概率 (B,),值域 [0, 1],>0.5 判定为 Deepfake
  • 音频预处理:2 秒窗口,16kHz,80-band mel spectrogram,功率归一化到 [0, 1]
  • 每人每日最多提交 5 次

评测指标说明:

  • EER(等错误率):FAR = FRR 时的错误率,越低越好
  • AUC(ROC 曲线下面积):衡量模型区分真实/伪造语音的能力,越高越好
  • Accuracy(准确率):分类正确的比例,越高越好