三年前,我开始用 Otter AI。
作为一个英语不算 native 的人,开会的时候总有那么几个瞬间——对方说了一串话,你大概懂了七八成,但剩下那两成就像鱼一样从指缝里滑走了。你知道它重要,但你抓不住。Otter 就是在这种时刻救了我的命。它能实时转录,能帮你把那些溜走的句子一字不差地钉在屏幕上。会后我可以回去复盘,查那些没听明白的词,做做功课。就像考试时偷偷多了一份参考答案,心里踏实很多。
但用久了,你会发现它本质上是一个"产品",而不是"你的工具"。
产品的边界,就是你痛苦的起点
什么意思呢?Otter 做得不错,但它是给所有人做的,不是给你做的。我有很多具体的、细碎的需求,它一个都满足不了。
比如最基本的——我希望转录过程中,看到一个不认识的词,点一下,马上出翻译。或者点一下整个句子,给我一个中文释义。就这么简单的功能,Otter 没有。它不需要,因为它的用户大多是 native speaker,人家不需要翻译。
再比如,我希望每隔三五分钟自动做一次中英文的阶段性总结,像 checkpoint 一样,让我在漫长的会议里不至于迷失方向。这个功能,Otter 也没有。
这些需求不大,但它们实实在在地卡在我的工作流里,像鞋里的沙子,不至于走不了路,但每一步都不舒服。
压死骆驼的最后一根稻草
如果只是功能不够,我大概还会继续忍。毕竟能用就行嘛。
但 Otter 干了一件让我寒心的事。
刚开始的时候,它还是很慷慨的,免费用户有 600 分钟的额度。后来我订阅了付费版,一个月 6000 分钟,绰绰有余。我一度觉得这是一家厚道的公司。
结果不知从哪天起,6000 分钟悄悄缩水到了 1200 分钟。
1200 分钟是什么概念?一天开三四个小时的会,一周就用完了。剩下三周你看着那个灰色的"额度已用尽"提示,就像到了月底看着银行卡余额一样无力。
我是个能忍的人,但我也是个记仇的人。你都这么不讲道义了,我也没必要再粘着你了。
那就自己造一个吧
说干就干。
技术栈很简单:用 Deepgram 做实时语音转录,用 GPT-4.1 Mini 做翻译和总结。Deepgram 的转录质量相当不错,而且注册就送 200 美金的额度——这 200 美金,按每小时不到 0.3 美元的价格算,够我用很久很久了。
断断续续花了一周,核心功能就全部到位了。
Otter 有的,它都有:
- 实时语音转录
- 会议结束后的完整总结
- 录音回放
Otter 没有的,它也有:
- 点击翻译:不认识的词,点一下出释义;不确定的句子,点一下出中文翻译
- 词汇表:每次总结会附带本次会议的重要词汇,自动帮你积累生词
- Checkpoint 总结:可以设置每三分钟或五分钟做一次中英文阶段汇总,再也不怕会议开着开着就走神了
- 同步回放:回放录音的同时,转录文本会自动高亮跟踪,像卡拉 OK 的歌词一样同步滚动
- 移动端:做了一个 Android 客户端,手机上也能用
成本呢?算一笔账。假设我每天开四个小时的会(当然实际上开不了这么多),Deepgram 的费用大概一天一美金,一个月也就 20 美金左右。GPT-4.1 Mini 的翻译和总结更便宜,几乎可以忽略不计。

总的来说——比 Otter 的订阅费便宜,功能还更多。唯一的代价是你得花一周时间把它造出来。
真正让我感慨的,不是这个工具本身
造完这个东西之后,我坐在椅子上发了会儿呆。
不是因为累,而是因为一种很奇妙的感觉涌上来——就好像你一直以为某座山很高,等你真的爬上去了,才发现其实也就那么回事。
回想一下,如果是五年前,十年前,我想做一个这样的工具,需要什么?首先你得学一门合适的语言,然后研究语音识别的 API,再搞定前后端,还要处理移动端适配,最后还得想办法部署上线。每一步都困难重重,每一步都可能劝退你。
这就是为什么程序员的工资一直很高——因为从需求到产品之间的那条路,过去真的很长很长,长到大多数人走不完。
但现在不一样了。
我把需求描述清楚,充当自己的产品经理,然后在技术层面做好把关。AI 帮我写了大量的代码,帮我处理了那些繁琐的细节。我需要做的,是想清楚"要什么"和"怎么判断好不好"。
一个人,一周,一个完整的产品。

创造力正在被无限放大
我越来越觉得,这个时代最珍贵的能力,不是写代码,而是发现问题的能力。
你知道自己的痛点在哪里。你知道市面上的产品哪里不够好。你知道什么样的方案能真正解决你的问题。这些,才是真正稀缺的东西。
至于实现——交给 AI。
前段时间我跟 AI 做了一次 brainstorm,聊的是怎么把个人技能变现。它给我理了几条路径,说得头头是道,当然说起来容易做起来难。但这个过程本身就让我觉得很有意思:你面前坐着一个永远不会不耐烦、永远不会敷衍你的"伙伴",你可以跟它反复推敲、打磨想法。
效率说不定比跟真人讨论还高。真人会走神,会有情绪,会因为面子不好意思说你的想法不靠谱。AI 不会。
当然,好的模型价格也不便宜。但跟它能帮你节省的时间和创造的价值比起来,这点成本真的不算什么。

写在最后
这篇文章不是一篇技术教程,也不是要踩 Otter 一脚。Otter 是个好产品,它帮了我三年,我对它是有感情的。
但它教会了我一件事:当你觉得一个工具不够好的时候,别抱怨,去造一个更好的。
这在以前是一句空话,因为造不出来。但在今天,它是一个真实的选项。
你不需要是一个全栈工程师,你不需要融资、组团队、写商业计划书。你只需要清楚地知道自己要什么,然后坐下来,花一周时间,把它做出来。
时代给了我们这个机会。别浪费它。