音记AI 利用了开源的 Whisper 模型,提供高效准确的语音识别功能。此外,它还实现了开箱即用的 GPU 加速 ,显著提升了处理速度和效率,为用户带来流畅的使用体验
支持将多种音频、视频文件实时转录为文本, 支持MP3, WAV, FLAC, ACC, M4A, MKV等。
支持监听麦克风音频并进行实时转录为文本,还可显示为歌词模式。
支持实时转录屏幕与应用的音频,跨国会议、上网课、看直播等场景必备。
转录后的文本可以导出为多种字幕格式,支持Srt、Vtt、Sub、Ass、Ssa、Lrc、Sbv、Smi等。
可以选择麦克风或者任何输入设备进行录制音频,然后再转录。
所有转录都在您的设备上完成,没有数据离开您的机器,非常适合敏感音频(比如采访)的使用。
支持M系列芯片的Mac设备上进行GPU加速转录,Windows平台支持使用Cuda、Vulkan引擎加速。
支持没有显卡的设备回退至使用CPU运行模型来转录。
支持调整whisper运行模型的参数(prompt、offset、greedy/beam search、entropy threshold等等)
支持翻译转录后的文本
你可以选择一个应用录制并稍后转录
使用AI加速你的工作流
更多的功能正在开发中
以下是一些用户常问的问题
准备好尝试音记AI了吗?
快速的将你的音频转换为文字
Contact us