📚 文档
最后更新: 2026-02-08全局实时转录(Beta)
TODO(新增截图):全局实时悬浮窗与状态栏(App 2.0) 建议包含:实时文本流、当前模型/语言、运行时状态(进行中/暂停/停止)、保存按钮。 建议文件名:
global-realtime-window-v2.png
功能边界
全局实时转录用于系统范围音频捕获与实时文本输出,属于 Beta 能力。
能力特点:
- 跨应用音频采集
- 独立实时窗口展示
- 与翻译/保存选项联动
适用场景
- 多应用切换下的连续会议记录
- 直播监听与重点抓取
- 需要系统级覆盖而非单应用采集
操作步骤
- 在首页点击“全局实时转录(Beta)”。
- 选择模型、语言和保存策略。
- 点击开始并确认实时窗口正常打开。
- 在运行中观察文本和状态提示。
- 结束后停止任务并检查结果归档。
运行稳定性建议
- 首次建议先跑 5~10 分钟短会话,确认系统权限链路完整。
- 长会话建议分段保存,避免单次任务过长导致恢复困难。
- 与其它高负载任务并行时,建议降低模型档位保障实时性。
真实场景:跨应用会议与演示并行记录
在“浏览器会议 + 本地演示 + IM 协作”同时进行时,单应用采集常会漏音。更稳妥的方式是:
- 开会前先做 5 分钟试录,确认系统权限与窗口显示正常。
- 会议中按阶段手动保存一次,避免长会话意外中断后无法回溯。
- 会后将结果导入笔记页,统一整理重点与待办。
常见误区
- 误区 1:直接长时间运行,不做试录。
纠正:Beta 阶段先短跑验证,比事后排障成本低很多。 - 误区 2:把全局实时当成默认方案。
纠正:如果只需要单应用采集,优先使用应用实时转录。 - 误区 3:忽略资源占用监控。
纠正:长会话期间观察 CPU/GPU 与内存,必要时降模型档位。
常见问题
Q: 为什么点击开始后没有弹出实时窗口?
A: 先检查系统权限、模型状态与功能开通状态。
Q: 全局实时和应用实时转录有何区别?
A: 全局实时是系统级捕获;应用实时转录是指定应用捕获。
Q: 能否长期后台运行?
A: 可以,但建议评估资源占用并定期保存结果。
限制说明
- 当前为 Beta,UI 与行为可能随版本调整。
- 通常需要已激活高级功能权限。
- 长时间运行会持续占用 CPU/GPU 与内存资源。
- 平台:Windows 与 macOS 均支持,但系统级音频捕获权限流程和稳定性表现不同。