📚 文档

面向 Audio Note 桌面端的快速上手指南，帮助你在 10 分钟内完成模型准备、首次转录与结果整理。

📚 文档文档

开始使用

工作台

主页工作台截图

真实截图

这页解决什么问题

第一次打开 Audio Note，最容易卡住的通常不是按钮位置，而是三件事：

先下载什么模型
第一个任务该用文件转录还是实时转录
转完之后该去哪里整理、导出和继续处理

这页不试图覆盖所有功能，而是先帮你跑通一条可复用的基础路径。

第一次使用，建议按这条路径走

打开 设置 > 转录，先确认模型目录、缓存目录和默认语言。
先下载一组“能跑通”的默认模型。
用一段 3~5 分钟的真实样本做第一次转录。
转录完成后进入笔记页，确认文本、导出和 AI 助手都可用。
再回头补做 GPU、批量、实时转录或高级参数配置。

这个顺序的重点是：先把第一轮体验做顺，再追求更快或更准。

第一次怎么选模型

第一次不需要把所有模型都装满。先根据任务和设备选一条路线：

你的目标	第一选择	为什么
先验证文件转录能不能稳定跑通	Whisper Small / Medium	质量和速度更平衡，适合做第一条基线
边说边出字，设备没有高性能 GPU	实时模型	更适合实时转录，通常不依赖 GPU
设备 GPU 很强，希望实时场景也兼顾准确率	Whisper	Whisper 在高性能 GPU 上也能达到不错的 RTF
低性能设备，只求先可用	轻量实时模型或 Whisper Tiny / Base	优先保证能稳定出字

实时模型 是 Audio Note 对一类更适合实时转录场景的语音模型统称。它们通常 RTF 表现更好、延迟更低、对设备更友好，且通常不依赖 GPU。

更完整的选型建议见使用模型建议，模型能力边界见概念。

第一次转录，建议这样验证

验证一：文件转录链路

先用一个真实音频或视频样本走一遍文件转录。这样最容易同时验证：

模型是否完整可用
路径和缓存是否正常
导出、笔记、AI 助手是否连得上

验证二：实时转录链路

如果你的主要工作流是会议、访谈或口述输入，再补测一次麦克风实时转录。第一次只看三件事：

延迟是否能接受
分段是否稳定
结束后是否能顺利进入笔记页

验证三：结果整理链路

转录完成后，不要停在“文本出来了”。至少再确认一遍：

在笔记页能否快速修正术语
在AI助手里能否生成摘要或行动项
导出格式是否符合你的下游工具需求

常见卡点与对应处理

模型很多，不知道先下哪个 先下 1 个文件转录模型和 1 个实时模型，不要一开始铺满所有档位。
第一次就想直接上最大模型 先用 Small / Medium 建立基线，再决定是否升级到 Large。
实时转录效果一般，就认为产品不适合自己 先区分是模型选择问题、设备问题还是音频链路问题，再决定是否换路线。
出了文本就直接外发 实时文本和首轮转录更适合做草稿，正式对外内容建议在笔记页做一次轻校对。

下一步阅读

想先理解模型能力边界：概念
想按设备和场景选模型：使用模型建议
准备跑第一个正式任务：文件转录
主要做会议或口述输入：麦克风实时转录
准备统一设置和下载策略：核心设置总览

Whisper大模型驱动 - 音视频秒转文字，声波流式转录，让每个声音都成篇章

Link

主页特性下载定价文档常见问题

Legal

隐私策略服务条款

Contact us

Copyright © 2026. Made by AudioNote, All rights reserved.