📚 文档
面向 Audio Note 桌面端的快速上手指南,帮助你在 10 分钟内完成模型准备、首次转录与结果整理。
📚 文档文档
开始使用
工作台
主页工作台截图
这页解决什么问题
第一次打开 Audio Note,最容易卡住的通常不是按钮位置,而是三件事:
- 先下载什么模型
- 第一个任务该用文件转录还是实时转录
- 转完之后该去哪里整理、导出和继续处理
这页不试图覆盖所有功能,而是先帮你跑通一条可复用的基础路径。
第一次使用,建议按这条路径走
- 打开
设置 > 转录,先确认模型目录、缓存目录和默认语言。 - 先下载一组“能跑通”的默认模型。
- 用一段 3~5 分钟的真实样本做第一次转录。
- 转录完成后进入笔记页,确认文本、导出和 AI 助手都可用。
- 再回头补做 GPU、批量、实时转录或高级参数配置。
这个顺序的重点是:先把第一轮体验做顺,再追求更快或更准。
第一次怎么选模型
第一次不需要把所有模型都装满。先根据任务和设备选一条路线:
| 你的目标 | 第一选择 | 为什么 |
|---|---|---|
| 先验证文件转录能不能稳定跑通 | Whisper Small / Medium | 质量和速度更平衡,适合做第一条基线 |
| 边说边出字,设备没有高性能 GPU | 实时模型 | 更适合实时转录,通常不依赖 GPU |
| 设备 GPU 很强,希望实时场景也兼顾准确率 | Whisper | Whisper 在高性能 GPU 上也能达到不错的 RTF |
| 低性能设备,只求先可用 | 轻量实时模型或 Whisper Tiny / Base | 优先保证能稳定出字 |
实时模型 是 Audio Note 对一类更适合实时转录场景的语音模型统称。它们通常 RTF 表现更好、延迟更低、对设备更友好,且通常不依赖 GPU。
第一次转录,建议这样验证
验证一:文件转录链路
先用一个真实音频或视频样本走一遍文件转录。这样最容易同时验证:
- 模型是否完整可用
- 路径和缓存是否正常
- 导出、笔记、AI 助手是否连得上
验证二:实时转录链路
如果你的主要工作流是会议、访谈或口述输入,再补测一次麦克风实时转录。第一次只看三件事:
- 延迟是否能接受
- 分段是否稳定
- 结束后是否能顺利进入笔记页
验证三:结果整理链路
转录完成后,不要停在“文本出来了”。至少再确认一遍:
常见卡点与对应处理
- 模型很多,不知道先下哪个 先下 1 个文件转录模型和 1 个实时模型,不要一开始铺满所有档位。
- 第一次就想直接上最大模型 先用 Small / Medium 建立基线,再决定是否升级到 Large。
- 实时转录效果一般,就认为产品不适合自己 先区分是模型选择问题、设备问题还是音频链路问题,再决定是否换路线。
- 出了文本就直接外发 实时文本和首轮转录更适合做草稿,正式对外内容建议在笔记页做一次轻校对。