该模型支持约 70 种语言,包括中文(普通话)、英语、西班牙语、德语、日语等,可自动识别文本语种,无需手动设置即可输出对应语言的语音。开发者只需调用一个统一接口,就能为有声书、播客、智能客服、语音助手、教育软件等应用快速提供多语种语音服务。
Gemini-TTS 还能与 Gemini 3.1 系列其他音频模型协同工作,在实时语音场景中发挥更强能力——例如电话沟通、会议翻译、车载导航等,既保持低延迟,又可通过文字指令和音频标记精细调控语音输出,使 AI 的语音交互更接近真人。
【版权提示】信息来自于互联网,不代表外贸内参立场,内容仅供网友参考学习。如发现本站内容存在版权问题,烦请提供版权疑问、身份证明、版权证明、联系方式等发邮件至[email protected],我们将及时沟通与处理。如若转载请联系原出处。