3月31日,阿里千问正式推出全新全模态大模型Qwen3.5-Omni。该模型提供Plus、Flash、Light三种规格的指令微调版本,最长可处理256K字符的上下文。它能接收长达10小时的音频,以及最高400秒、720P分辨率(每秒1帧)的音视频输入。语音识别覆盖113种语言和方言,语音合成支持36种语言和方言。用户可通过离线API和实时API两种方式体验。