上传语音防伪模型
赛题三 · Deepfake 语音检测 · AI 合成语音识别
拖拽 .pt 文件到此处,或点击选择文件
仅支持 .pt / .pth 格式,最大 200MB
上传中...
提交须知:
- 提交 PyTorch 模型(
torch.nn.Module),保存为 .pt 或 .pth 文件 - 模型输入:Mel 频谱图张量
(B, 1, 80, T),16kHz 采样率,80-band mel - 模型输出:伪造概率
(B,),值域 [0, 1],>0.5 判定为 Deepfake - 音频预处理:2 秒窗口,16kHz,80-band mel spectrogram,功率归一化到 [0, 1]
- 每人每日最多提交 5 次
评测指标说明:
- EER(等错误率):FAR = FRR 时的错误率,越低越好
- AUC(ROC 曲线下面积):衡量模型区分真实/伪造语音的能力,越高越好
- Accuracy(准确率):分类正确的比例,越高越好