微软语音服务,提供语音到文本、文本到语音和语音翻译功能。
它允许用户创建自定义的语音识别模型,以及提供访问一系列预先训练的模型。它还提供了用于创建和管理自定义语音的工具。
Speech Studio是一套用于构建和集成Azure认知服务语音服务功能到应用程序中的工具。它为创建项目提供了一种无需代码的方法,可以访问诸如实时语音到文本、自定义语音识别模型、发音评估、语音库、自定义语音、音频内容创建、自定义关键字和自定义命令等功能。
根据文本生成多种逼真的语音
设计和开发音频优先的产品和数据驱动的解决方案
IBM Watson文字转语音
出门问问推出的Agent AI智能硬件
Verbatik是一款AI驱动的文本到语音生成器,包含142种语言和口音的600多种自然声音
科大讯飞旗下一站式AI音视频创作平台