| Model,voxceleb_accent_test,imda_ar_sentence,imda_ar_dialogue | |
| Qwen-Audio-Chat,48.05088223225277,3.933333333333333,0.6666666666666667 | |
| hy_whisper_local_cs,,, | |
| Qwen2-Audio-7B-Instruct,29.187525646286417,2.55,0.9666666666666668 | |
| whisper_large_v3,,, | |
| old_models,,, | |
| gemini-1.5-flash,,, | |
| WavLLM_fairseq,39.96717275338531,2.6833333333333336,0.2333333333333333 | |
| MERaLiON-AudioLLM-Whisper-SEA-LION,47.066064833812064,6.333333333333334,78.0 | |
| MERaLiON-AudioLLM-v2-2b,66.59827656955272,59.73333333333334,53.833333333333336 | |
| MERaLiON-AudioLLM-v2-9b,40.78785391875257,30.325000000000006,54.333333333333336 | |
| MERaLiON-AudioLLM-v2-9b-asr,18.38325810422651,58.25,66.73333333333333 | |
| Qwen2.5-Omni-3B,0.9027492819039803,0.1,0.4333333333333333 | |
| Qwen2.5-Omni-7B,1.661879359868691,0.06666666666666667,0.03333333333333333 | |
| SALMONN_7B,31.69881001231022,2.833333333333333,0.2 | |
| SeaLLMs-Audio-7B,9.848173984407058,3.85,16.733333333333334 | |
| cascade_whisper_large_v2_gemma2_9b_cpt_sea_lionv3_instruct,28.00574476815757,38.983333333333334,10.8 | |
| cascade_whisper_large_v3_llama_3_8b_instruct,40.29544521953221,13.733333333333334,10.166666666666666 | |
| phi_4_multimodal_instruct,2.6261797291752154,6.133333333333333,0.5333333333333333 | |