上传语音防伪模型

赛题三 · Deepfake 语音检测 · AI 合成语音识别

拖拽 .pt 文件到此处，或点击选择文件

仅支持 .pt / .pth 格式，最大 200MB

提交须知：

提交 PyTorch 模型（torch.nn.Module），保存为 .pt 或 .pth 文件
模型输入：Mel 频谱图张量 (B, 1, 80, T)，16kHz 采样率，80-band mel
模型输出：伪造概率 (B,)，值域 [0, 1]，>0.5 判定为 Deepfake
音频预处理：2 秒窗口，16kHz，80-band mel spectrogram，功率归一化到 [0, 1]
每人每日最多提交 5 次

评测指标说明：

EER（等错误率）：FAR = FRR 时的错误率，越低越好
AUC（ROC 曲线下面积）：衡量模型区分真实/伪造语音的能力，越高越好
Accuracy（准确率）：分类正确的比例，越高越好