Whisper是一个开源的自动语音识别系统,经过68万小时的多语言和多任务监督数据训练
这个实验让你拍下某物的照片,听一听如何用另一种语言说它。这只是使用谷歌的机器学习API可以实现的一个示例,而不需要深入研究机器学习的细节。