📚 文档
最后更新: 2026-02-08

全局实时转录(Beta)

TODO(新增截图):全局实时悬浮窗与状态栏(App 2.0) 建议包含:实时文本流、当前模型/语言、运行时状态(进行中/暂停/停止)、保存按钮。 建议文件名:global-realtime-window-v2.png

功能边界

全局实时转录用于系统范围音频捕获与实时文本输出,属于 Beta 能力。

能力特点:

  • 跨应用音频采集
  • 独立实时窗口展示
  • 与翻译/保存选项联动

适用场景

  • 多应用切换下的连续会议记录
  • 直播监听与重点抓取
  • 需要系统级覆盖而非单应用采集

操作步骤

  1. 在首页点击“全局实时转录(Beta)”。
  2. 选择模型、语言和保存策略。
  3. 点击开始并确认实时窗口正常打开。
  4. 在运行中观察文本和状态提示。
  5. 结束后停止任务并检查结果归档。

运行稳定性建议

  • 首次建议先跑 5~10 分钟短会话,确认系统权限链路完整。
  • 长会话建议分段保存,避免单次任务过长导致恢复困难。
  • 与其它高负载任务并行时,建议降低模型档位保障实时性。

真实场景:跨应用会议与演示并行记录

在“浏览器会议 + 本地演示 + IM 协作”同时进行时,单应用采集常会漏音。更稳妥的方式是:

  1. 开会前先做 5 分钟试录,确认系统权限与窗口显示正常。
  2. 会议中按阶段手动保存一次,避免长会话意外中断后无法回溯。
  3. 会后将结果导入笔记页,统一整理重点与待办。

常见误区

  • 误区 1:直接长时间运行,不做试录。
    纠正:Beta 阶段先短跑验证,比事后排障成本低很多。
  • 误区 2:把全局实时当成默认方案。
    纠正:如果只需要单应用采集,优先使用应用实时转录
  • 误区 3:忽略资源占用监控。
    纠正:长会话期间观察 CPU/GPU 与内存,必要时降模型档位。

常见问题

Q: 为什么点击开始后没有弹出实时窗口?
A: 先检查系统权限、模型状态与功能开通状态。

Q: 全局实时和应用实时转录有何区别?
A: 全局实时是系统级捕获;应用实时转录是指定应用捕获。

Q: 能否长期后台运行?
A: 可以,但建议评估资源占用并定期保存结果。

限制说明

  • 当前为 Beta,UI 与行为可能随版本调整。
  • 通常需要已激活高级功能权限。
  • 长时间运行会持续占用 CPU/GPU 与内存资源。
  • 平台:Windows 与 macOS 均支持,但系统级音频捕获权限流程和稳定性表现不同。
Whisper大模型驱动 - 音视频秒转文字,声波流式转录,让每个声音都成篇章

Contact us

Email
Copyright © 2026. Made by AudioNote, All rights reserved.