📚 文档
最后更新: 2026-02-08Audio Note 快速开始
本文档适用于桌面端(Windows/macOS),帮助你在 10 分钟内完成首个可用工作流。

TODO(截图替换):首页总览(App 2.0 最新 UI) 建议包含:左侧导航、首页四个入口卡片(文件转录/麦克风实时转录/应用实时转录/链接转录)、顶部输入区与最近任务列表。 建议文件名:
home-overview-v2.png
术语速览
- Whisper 模型:偏“准确率优先”的离线转录模型,通常更稳但更吃资源。
- 实时模型(Sherpa):偏“低延迟优先”的模型,适合边说边出字场景。
- 工作空间:把不同项目的数据隔离存放,避免素材和笔记混在一起。
- 监控(Watch):持续监听目录中新文件并自动发起转录任务。
- Beta:功能仍在迭代中,UI 和行为可能变化,默认可能灰度开放。
功能边界
Audio Note 2.0 目前聚焦桌面端语音转写与笔记协同,主要包括:
- 文件转录与批量转录
- 麦克风实时转录 / 应用实时转录
- 录音、录制应用后转录
- 链接转录(下载 + 转录一体化)
- 文件夹监控(Watch)
- 工作空间、笔记、AI 助手
- 全局实时转录(Beta)
- 听写(即将上线,当前版本默认不开放)
适用场景
- 会议纪要:会议录音、线上会议、回放材料统一转写
- 学习记录:课程音视频转文本,沉淀笔记
- 内容创作:播客/视频素材整理、提炼摘要
- 团队协作:按工作空间隔离项目资料,统一检索与追踪
操作步骤
- 下载并安装桌面端:访问 下载页。
- 首次启动后进入
设置,确认模型目录与下载路径。 - 在
设置 > 转录下载至少一个 Whisper 或实时模型。 - 回到首页执行任一入口:
- 转录文件(本地文件)
- 麦克风实时转录
- 应用实时转录(应用声音)
- 链接转录(粘贴 URL)
- 转录完成后在
笔记页查看全文、摘要、AI 对话与导出能力。 - 需要长期自动化时,进入
监控配置文件夹监控任务。 - 多项目并行时,先切换到目标工作空间再开始任务。
一个真实上手路径(会议复盘版)
假设你刚开完一场 60 分钟线上会议,目标是在 20 分钟内产出可发团队群的纪要,可以按下面走:
- 先把会议录音拖进“文件转录”,用 Small 或 Medium 跑首轮文本。
- 在“笔记”页先修人名、数字、术语,再让 AI 助手提炼行动项。
- 导出 Markdown 发给团队;若需要回看时间点,再补导出 SRT。
新用户首日完成清单(建议)
- 完成 1 次“文件转录”并成功导出 TXT 或 SRT。
- 完成 1 次“麦克风实时转录”验证设备权限链路。
- 在“笔记”页试一次 AI 总结,确认账号与模型可用。
- 检查
设置 > 下载并发,避免默认值过高导致失败。
常见误区(先避坑)
- 一上来就选最大模型:看起来“最强”,但低配机器容易变慢甚至失败。
- 不做小样本验证就批量跑:一旦参数错,后续返工成本很高。
- 只看 AI 结果不复核:对外内容发布前,数字、日期、结论建议人工过一遍。
推荐继续阅读:
常见问题
Q: 必须登录才能用吗?
A: 取决于你的功能需求。基础本地转录可直接使用,云端能力与订阅相关功能需要登录。
Q: 为什么首次启动可用功能比文档少?
A: 你的账号功能开通状态、平台权限和模型下载状态会影响可见入口。
Q: 文档里的 Beta 功能在哪里开启?
A: 以应用内功能开关与版本通道为准,Beta 功能可能灰度开放;未上线功能会先隐藏文档入口。
限制说明
- 平台限制:仅桌面端(Windows/macOS)。
- 功能限制:部分高级能力仅对已激活订阅开放。
- Beta 限制:全局实时转录可能在不同版本/账号下表现不同。
- 上线状态:听写功能仍在发布准备阶段,当前默认不对外开放。
- 资源限制:大模型与并发任务依赖 CPU/GPU/内存,低配设备建议使用轻量模型。