📚 文档
最后更新: 2026-02-08应用实时转录

TODO(截图替换):应用实时转录页面(App 2.0) 建议包含:应用选择下拉、麦克风叠加开关、实时字幕区、状态栏(运行中/暂停/停止)。 建议文件名:
realtime-app-v2.png
功能边界
实时应用转录用于“指定应用窗口/系统会话”的声音采集与实时转录,支持:
- 应用音频实时采集
- 可选同时采集麦克风
- 过程内字幕式文本反馈
- 结束后转入笔记与导出流程
不负责 URL 下载;URL 内容请使用链接转录。
适用场景
- 在线会议(Zoom/Teams/Meet)
- 视频课程与直播回放
- 游戏/应用内语音内容留档
操作步骤
- 在首页点击“应用实时转录”。
- 选择模型与语言,确认应用捕获权限。
- 在应用列表中选择目标应用(可选启用麦克风)。
- 点击开始,观察实时文本与状态变化。
- 结束任务后,在笔记页继续整理与导出。
使用前检查(推荐)
- 先关闭不相关音源,减少系统混音干扰。
- 建议目标应用避免全屏(尤其是 macOS)并保持在可捕获层级。
- 优先选择稳定输出设备,避免蓝牙设备频繁切换。
- 首次使用建议先跑 3~5 分钟短任务验证稳定性。
名词解释(避免误解)
- 应用采集:只针对选中的应用音频源,不等于全系统所有声音。
- 系统混音:操作系统可能把多个声音流混到同一设备,导致边界不完全隔离。
- Space(macOS):不同桌面层级会影响窗口捕获权限与可见性。
真实使用路径(线上会议)
一个常见目标是:会后 10 分钟内拿到“可读版会议文本”。
- 开会前 3 分钟先做短测:确认应用可选中、字幕可刷新。
- 开会时只保留核心音源,减少系统提示音干扰。
- 结束后立即在笔记页修人名和行动项,再导出分享版本。
常见问题
Q: 可以同时转录多个应用吗?
A: 仅支持选择一个应用进行转录,但可以同时录制麦克风音频。
Q: 为什么其它应用发出的声音也会被转录?
A: 这是由于系统原因导致的,您可以尝试关闭其他应用和系统声音。
Q: 为什么 macOS 中的应用全屏后或者应用移动到其它 Space 后无法录制?
A: 这通常是由 macOS 安全限制引起的:不在同一窗口层级的应用可能无法被稳定捕获。建议将目标应用保持在同一 Space 且非全屏状态。
Q: 应用实时转录延迟有多大?
A: 延迟受模型大小、系统负载、音频链路和 GPU 引擎共同影响,无法用单一数值概括。建议先用 3~5 分钟样本实测,再确定默认配置;低配设备优先实时模型。
常见误区与替代做法
- 误区:会议开始后才临时调权限
替代:会前短测,提前完成权限授权与设备确认。 - 误区:边开会边频繁切换设备
替代:开会期间固定音频设备,结束后再做切换测试。 - 误区:把实时字幕直接外发
替代:先在笔记页做 3~5 分钟快速校对后再分发。
限制说明
- 状态:稳定(非 Beta),如有灰度限制会在应用内提示。
- 应用采集受操作系统权限与安全策略影响。
- 全屏应用或跨空间(macOS Space)场景可能导致采集失败。
- 部分账号套餐不开放该能力,具体以应用内功能开关为准。
- 平台:Windows 与 macOS 都支持,差异集中在音频路由和窗口层级权限模型。