📚 文档
最后更新: 2026-02-08

应用实时转录

TODO(截图替换):应用实时转录页面(App 2.0) 建议包含:应用选择下拉、麦克风叠加开关、实时字幕区、状态栏(运行中/暂停/停止)。 建议文件名:realtime-app-v2.png

功能边界

实时应用转录用于“指定应用窗口/系统会话”的声音采集与实时转录,支持:

  • 应用音频实时采集
  • 可选同时采集麦克风
  • 过程内字幕式文本反馈
  • 结束后转入笔记与导出流程

不负责 URL 下载;URL 内容请使用链接转录

适用场景

  • 在线会议(Zoom/Teams/Meet)
  • 视频课程与直播回放
  • 游戏/应用内语音内容留档

操作步骤

  1. 在首页点击“应用实时转录”。
  2. 选择模型与语言,确认应用捕获权限。
  3. 在应用列表中选择目标应用(可选启用麦克风)。
  4. 点击开始,观察实时文本与状态变化。
  5. 结束任务后,在笔记页继续整理与导出。

使用前检查(推荐)

  • 先关闭不相关音源,减少系统混音干扰。
  • 建议目标应用避免全屏(尤其是 macOS)并保持在可捕获层级。
  • 优先选择稳定输出设备,避免蓝牙设备频繁切换。
  • 首次使用建议先跑 3~5 分钟短任务验证稳定性。

名词解释(避免误解)

  • 应用采集:只针对选中的应用音频源,不等于全系统所有声音。
  • 系统混音:操作系统可能把多个声音流混到同一设备,导致边界不完全隔离。
  • Space(macOS):不同桌面层级会影响窗口捕获权限与可见性。

真实使用路径(线上会议)

一个常见目标是:会后 10 分钟内拿到“可读版会议文本”。

  1. 开会前 3 分钟先做短测:确认应用可选中、字幕可刷新。
  2. 开会时只保留核心音源,减少系统提示音干扰。
  3. 结束后立即在笔记页修人名和行动项,再导出分享版本。

常见问题

Q: 可以同时转录多个应用吗?

A: 仅支持选择一个应用进行转录,但可以同时录制麦克风音频。

Q: 为什么其它应用发出的声音也会被转录?

A: 这是由于系统原因导致的,您可以尝试关闭其他应用和系统声音。

Q: 为什么 macOS 中的应用全屏后或者应用移动到其它 Space 后无法录制?

A: 这通常是由 macOS 安全限制引起的:不在同一窗口层级的应用可能无法被稳定捕获。建议将目标应用保持在同一 Space 且非全屏状态。

Q: 应用实时转录延迟有多大?

A: 延迟受模型大小、系统负载、音频链路和 GPU 引擎共同影响,无法用单一数值概括。建议先用 3~5 分钟样本实测,再确定默认配置;低配设备优先实时模型。

常见误区与替代做法

  • 误区:会议开始后才临时调权限
    替代:会前短测,提前完成权限授权与设备确认。
  • 误区:边开会边频繁切换设备
    替代:开会期间固定音频设备,结束后再做切换测试。
  • 误区:把实时字幕直接外发
    替代:先在笔记页做 3~5 分钟快速校对后再分发。

限制说明

  • 状态:稳定(非 Beta),如有灰度限制会在应用内提示。
  • 应用采集受操作系统权限与安全策略影响。
  • 全屏应用或跨空间(macOS Space)场景可能导致采集失败。
  • 部分账号套餐不开放该能力,具体以应用内功能开关为准。
  • 平台:Windows 与 macOS 都支持,差异集中在音频路由和窗口层级权限模型。
Whisper大模型驱动 - 音视频秒转文字,声波流式转录,让每个声音都成篇章

Contact us

Email
Copyright © 2026. Made by AudioNote, All rights reserved.