AI语音识别-音转文

播记是一款专为播客创作者打造的智能shownotes生成工具。通过AI技术，帮助创作者快速生成高质量的播客shownotes，提升创作效率，优化内容管理。支持多种格式导出，让播客创作更轻松。

Buzz作为一个音频转录和翻译工具，凭借其离线运行、多种语言支持、易于安装和使用的优点，为用户提供了便捷的音频处理解决方案

TTS语音向导是一种工具，允许用户通过微软Azure语音识别和TTS将语音转换为文本，然后再转换回语音。它还向VRChat发送OSC消息以在头像上显示文本。该工具有许多自定义选项，包括100多种不同的声音，20多种支持的语言，并能够显示歌曲标题，艺术家和用户以上的进度。

Pictory是一个完美的视频营销工具，可以从您的长形式内容中制作简短，高度共享的品牌视频。

悦录依托同花顺的语音识别技术，为用户提供免费的录音转文字、语音转文字、视频字幕等服务，1小时音频最快5分钟出稿，准确率高达97%+，全程加密，文件信息安全。

AI智能配音工具，独有的AI智能配音技术，更专业，完美贴近真人配音，AI模仿真人情感（怀旧、欢快、激情、伤心、抒情、惊讶等），支持多音字、停顿、整数、小数、数字等特色发音，快捷的单人、多人配音模式，海量的音色库，近千种免费音色，覆盖短视频、政企宣传、教育、动漫、有声读物、影视广告等数百行业场景。

听脑AI是一款AI智能语音助手，专注于语音转文本和实时录音总结，提供音视频转文字、实时录音转文本、AI总结、章节速览等功能。用户可以通过自由拖动文本查看音视频进度，享受便捷的智能记录体验，通过智能化处理，以提升用户在会议、课堂、面试等场景的记录效率，让用户更便捷地获取和整理信息。

Whisper是一个开源的自动语音识别系统，经过68万小时的多语言和多任务监督数据训练

Speech Studio是一套用于构建和集成Azure认知服务语音服务功能到应用程序中的工具。它为创建项目提供了一种无需代码的方法，可以访问诸如实时语音到文本、自定义语音识别模型、发音评估、语音库、自定义语音、音频内容创建、自定义关键字和自定义命令等功能。

FineVoice是一种人工智能数字语音解决方案，可以帮助用户增强声音，并实时改变声音。它配有实时变声器，无限的音频和声音效果，录音室质量的录音机，文本到语音，语音到文本。

AI驱动的音频增强语音通过消...

Notta是由MIND CRUISER LIMITED推出的语音转写软件，主要针对个人使用，并在海外拥有数十万用户。这款软件具有录音实时转写、音/视频导入转写、文本多格式导出、音频标记等功能，并能实时录音时进行文字直播、插入图片等。