📚 文档
最后更新: 2026-02-08

Audio Note 快速开始

本文档适用于桌面端(Windows/macOS),帮助你在 10 分钟内完成首个可用工作流。

TODO(截图替换):首页总览(App 2.0 最新 UI) 建议包含:左侧导航、首页四个入口卡片(文件转录/麦克风实时转录/应用实时转录/链接转录)、顶部输入区与最近任务列表。 建议文件名:home-overview-v2.png

术语速览

  • Whisper 模型:偏“准确率优先”的离线转录模型,通常更稳但更吃资源。
  • 实时模型(Sherpa):偏“低延迟优先”的模型,适合边说边出字场景。
  • 工作空间:把不同项目的数据隔离存放,避免素材和笔记混在一起。
  • 监控(Watch):持续监听目录中新文件并自动发起转录任务。
  • Beta:功能仍在迭代中,UI 和行为可能变化,默认可能灰度开放。

功能边界

Audio Note 2.0 目前聚焦桌面端语音转写与笔记协同,主要包括:

  • 文件转录与批量转录
  • 麦克风实时转录 / 应用实时转录
  • 录音、录制应用后转录
  • 链接转录(下载 + 转录一体化)
  • 文件夹监控(Watch)
  • 工作空间、笔记、AI 助手
  • 全局实时转录(Beta)
  • 听写(即将上线,当前版本默认不开放)

适用场景

  • 会议纪要:会议录音、线上会议、回放材料统一转写
  • 学习记录:课程音视频转文本,沉淀笔记
  • 内容创作:播客/视频素材整理、提炼摘要
  • 团队协作:按工作空间隔离项目资料,统一检索与追踪

操作步骤

  1. 下载并安装桌面端:访问 下载页
  2. 首次启动后进入 设置,确认模型目录与下载路径。
  3. 设置 > 转录 下载至少一个 Whisper 或实时模型。
  4. 回到首页执行任一入口:
    • 转录文件(本地文件)
    • 麦克风实时转录
    • 应用实时转录(应用声音)
    • 链接转录(粘贴 URL)
  5. 转录完成后在 笔记 页查看全文、摘要、AI 对话与导出能力。
  6. 需要长期自动化时,进入 监控 配置文件夹监控任务。
  7. 多项目并行时,先切换到目标工作空间再开始任务。

一个真实上手路径(会议复盘版)

假设你刚开完一场 60 分钟线上会议,目标是在 20 分钟内产出可发团队群的纪要,可以按下面走:

  1. 先把会议录音拖进“文件转录”,用 Small 或 Medium 跑首轮文本。
  2. 在“笔记”页先修人名、数字、术语,再让 AI 助手提炼行动项。
  3. 导出 Markdown 发给团队;若需要回看时间点,再补导出 SRT。

新用户首日完成清单(建议)

  • 完成 1 次“文件转录”并成功导出 TXT 或 SRT。
  • 完成 1 次“麦克风实时转录”验证设备权限链路。
  • 在“笔记”页试一次 AI 总结,确认账号与模型可用。
  • 检查 设置 > 下载 并发,避免默认值过高导致失败。

常见误区(先避坑)

  • 一上来就选最大模型:看起来“最强”,但低配机器容易变慢甚至失败。
  • 不做小样本验证就批量跑:一旦参数错,后续返工成本很高。
  • 只看 AI 结果不复核:对外内容发布前,数字、日期、结论建议人工过一遍。

推荐继续阅读:

常见问题

Q: 必须登录才能用吗?
A: 取决于你的功能需求。基础本地转录可直接使用,云端能力与订阅相关功能需要登录。

Q: 为什么首次启动可用功能比文档少?
A: 你的账号功能开通状态、平台权限和模型下载状态会影响可见入口。

Q: 文档里的 Beta 功能在哪里开启?
A: 以应用内功能开关与版本通道为准,Beta 功能可能灰度开放;未上线功能会先隐藏文档入口。

限制说明

  • 平台限制:仅桌面端(Windows/macOS)。
  • 功能限制:部分高级能力仅对已激活订阅开放。
  • Beta 限制:全局实时转录可能在不同版本/账号下表现不同。
  • 上线状态:听写功能仍在发布准备阶段,当前默认不对外开放。
  • 资源限制:大模型与并发任务依赖 CPU/GPU/内存,低配设备建议使用轻量模型。
Whisper大模型驱动 - 音视频秒转文字,声波流式转录,让每个声音都成篇章

Contact us

Email
Copyright © 2026. Made by AudioNote, All rights reserved.