📚 文档

面向 Audio Note 桌面端的快速上手指南,帮助你在 10 分钟内完成模型准备、首次转录与结果整理。

📚 文档文档

开始使用

工作台

主页工作台截图

真实截图

这页解决什么问题

第一次打开 Audio Note,最容易卡住的通常不是按钮位置,而是三件事:

  • 先下载什么模型
  • 第一个任务该用文件转录还是实时转录
  • 转完之后该去哪里整理、导出和继续处理

这页不试图覆盖所有功能,而是先帮你跑通一条可复用的基础路径。

第一次使用,建议按这条路径走

  1. 打开 设置 > 转录,先确认模型目录、缓存目录和默认语言。
  2. 先下载一组“能跑通”的默认模型。
  3. 用一段 3~5 分钟的真实样本做第一次转录。
  4. 转录完成后进入笔记页,确认文本、导出和 AI 助手都可用。
  5. 再回头补做 GPU、批量、实时转录或高级参数配置。

这个顺序的重点是:先把第一轮体验做顺,再追求更快或更准。

第一次怎么选模型

第一次不需要把所有模型都装满。先根据任务和设备选一条路线:

你的目标第一选择为什么
先验证文件转录能不能稳定跑通Whisper Small / Medium质量和速度更平衡,适合做第一条基线
边说边出字,设备没有高性能 GPU实时模型更适合实时转录,通常不依赖 GPU
设备 GPU 很强,希望实时场景也兼顾准确率WhisperWhisper 在高性能 GPU 上也能达到不错的 RTF
低性能设备,只求先可用轻量实时模型或 Whisper Tiny / Base优先保证能稳定出字

实时模型 是 Audio Note 对一类更适合实时转录场景的语音模型统称。它们通常 RTF 表现更好、延迟更低、对设备更友好,且通常不依赖 GPU。

更完整的选型建议见使用模型建议,模型能力边界见概念

第一次转录,建议这样验证

验证一:文件转录链路

先用一个真实音频或视频样本走一遍文件转录。这样最容易同时验证:

  • 模型是否完整可用
  • 路径和缓存是否正常
  • 导出、笔记、AI 助手是否连得上

验证二:实时转录链路

如果你的主要工作流是会议、访谈或口述输入,再补测一次麦克风实时转录。第一次只看三件事:

  • 延迟是否能接受
  • 分段是否稳定
  • 结束后是否能顺利进入笔记页

验证三:结果整理链路

转录完成后,不要停在“文本出来了”。至少再确认一遍:

  • 笔记页能否快速修正术语
  • AI助手里能否生成摘要或行动项
  • 导出格式是否符合你的下游工具需求

常见卡点与对应处理

  • 模型很多,不知道先下哪个 先下 1 个文件转录模型和 1 个实时模型,不要一开始铺满所有档位。
  • 第一次就想直接上最大模型 先用 Small / Medium 建立基线,再决定是否升级到 Large。
  • 实时转录效果一般,就认为产品不适合自己 先区分是模型选择问题、设备问题还是音频链路问题,再决定是否换路线。
  • 出了文本就直接外发 实时文本和首轮转录更适合做草稿,正式对外内容建议在笔记页做一次轻校对。

下一步阅读

Whisper大模型驱动 - 音视频秒转文字,声波流式转录,让每个声音都成篇章

Contact us

Email
Copyright © 2026. Made by AudioNote, All rights reserved.