最后更新: 2025-05-11

实时转录应用

实时应用转录是音记AI的另一项创新功能,允许用户选择并转录特定应用的音频。无论是转录在线会议、视频内容还是在线直播,这一功能都能提供灵活、便捷的解决方案。

功能概述

实时应用转录功能允许用户选择并转录特定应用的音频,支持同时录制麦克风音频。所有处理都在本地完成,确保数据安全和隐私。主要特点包括:

  • 精准音频捕获:支持选择特定应用的音频流
  • 双重音频输入:可同时录制应用音频和麦克风
  • 智能语音检测:自动过滤无声片段
  • 多语言支持:支持98+种语言转录
  • 实时字幕生成:可生成实时字幕并显示

主要功能

  • 模型选择:用户可以选择 Whisper 模型或实时模型,根据需求平衡准确性和速度。
  • 边录边转:软件支持在录制音频的同时进行实时转录,无需等待录制完成。
  • VAD(语音活动检测):自动检测语音活动,确保只转录有意义的内容,减少空白和噪音。
  • 动态切换麦克风:在转录过程中,用户可以无缝切换不同的麦克风设备。
  • 实时翻译:支持将实时转录的文本实时翻译为其他语言,方便多语言沟通。
  • 字幕模式:支持将实时转录的文本实时显示为字幕。
  • 详细模式:支持查看每次语音转录文本,防止错过关键信息。

使用场景

在线会议

  • 实时转录Zoom、Teams等会议内容
  • 生成会议纪要
  • 保存重要讨论内容

视频学习

  • 转录YouTube、B站等平台的教学视频
  • 生成学习笔记
  • 制作双语字幕

游戏直播

  • 记录游戏实况解说
  • 保存精彩时刻
  • 制作直播回放字幕

线上上课

  • 转录在线课程内容
  • 生成课程笔记
  • 制作教学资料

如何使用

  1. 打开软件首页选择“实时转录应用”。
  2. 选择您偏好的转录模型(Whisper模型或实时模型)以及转录语言。
  3. 选择要使用的麦克风设备(或者禁用麦克风)。
  4. 配置转录选项,如是否启用GPU转录(建议开启获得更好的体验)、VAD、实时翻译等。
  5. 点击“开始”按钮。
  6. 软件将开始录制并实时显示转录的文字。
  7. 您可以随时切换、开启麦克风或停止转录。

常见问题

Q: 可以同时转录多个应用吗?

A: 仅支持选择一个应用进行转录,但可以同时录制麦克风音频。

Q: 为什么其它应用发出的声音也会被转录?

A: 这是由于系统原因导致的,您可以尝试关闭其他应用和系统声音。

Q: 为什么MacOS中的应用全屏后或者应用移动到其它Space后无法录制?

A: 这是由于MacOS安全限制导致无法获取不在同一个层级中的应用屏幕,因此请确保被录制的应用在同一个层级中且不是全屏状态。

Q: 实时转录延迟有多大?

A: 当设备性能足够的情况下,开启GPU加速时,延迟通常小于500ms,若设备性能不足,请使用实时模型。

Whisper大模型驱动 - 音视频秒转文字,声波流式转录,让每个声音都成篇章

Contact us

Email
Copyright © 2025. Made by AudioNote, All rights reserved.