AIGC 火了之后,对话式 AI 机器人、文生图,成为了创业者们的 2 个主要“战场”。之后我们逐渐发现 AI 在音频领域的应用开始出现了一些进展,包括声音模拟与生成、基于 AI 的语言学习、以及基于 Prompts 的音乐生成。到了 5 月份,AI 在音频领域的应用也体现在了榜单上,可参阅我们之前发布的选题《热度仅次于 Temu,2 款音频 App 无视流量困境野蛮增长》。

而其中的一个主角、提供变声解决方案的 Voice.ai,在完成了早期增长之后,最近拿到了 600 万美金的融资,由 Mucker Capital 和 M13 领投,这也是他们的第一轮外部融资。在此之前,Voice.ai 自行筹集了 300 万美金启动资金,从 Discord 频道起步,通过口碑传播实现增长。根据 TechCrunch 的消息,Voice.ai 目前已经获取了 48 万+用户,声音滤镜也已经有 5 万多种。

目前,Voice.ai 的变声解决方案,支持 PC、安卓和 iOS 多个终端,使用者包括内容创作者、VTuber、玩家,可支持的平台包括 TikTok、Zoom 等社交和视频会议软件以及 MineCraft、Fortnite、Among Us 等游戏。玩家或者创作者可以自己训练新的声音,或者使用 5 万多种预先训练好的声音模型。

而这次融资之后,Voice.ai 希望招聘更多而技术人才,同时研发新的 SDK 和 API 来支持更多平台,例如 Meta、或者 Unreal 和 Unity 等游戏引擎,同时也希望去扩充支持的语言、以及新增一些应用场景,如唱歌等等。而至于是否会将资金用于服务器扩容,团队并未提及。

根据 CEO 对 TechCrunch 的描述,用户在使用 App 时,声音会在本地进行处理,但会通过一个“传输声音的虚拟线缆”的结构(请意会)传输到用户使用的平台上,如 TikTok、或者一些游戏中。这也导致应用当前无法同时服务太多人,从 App 评论也能窥得一二。

在 voice-to-voice 细分赛道里面, Respeecher 和 ElevenLabs 是两个主要玩家,后者不久前刚完成最新一轮 1900 万美金的融资。在这个细分赛道里面,Voice.ai 现阶段将自己定位成“每一个人的 AI 变声 App。”创始人解释,在 AI 声音赛道,很多企业进入的时候都将眼光瞄向了 toB 的解决方案,但我们基本上是反其道而行。把 AI 声音的“魔力”带给 C 端用户,其中的关键是在替换声音的同时,保留一个人说话的重音、语调和情绪,这是核心价值主张。

由于在游戏中使用变声服务是一个很常见的场景,Voice.ai 目前的用画像是男女 7:3。但创始人还提及了很多应用场景,例如现在很多用户会有自己的 Avatar,相应地,用户会给自己建立一个与 Avatar 形象相匹配的声音(同理的还有 transgender 人群),或者很多用户很重视隐私,他们也会使用变声服务。

虽然,Voice.ai 给自己的定位是 toC,但这一轮的领投机构 Mucker Capital 并不这么想。曾创建了 AdMob(后来被谷歌收购)、现在在 Mucker Capital 担任合伙人的 Hamoui 认为,Voice.ai 有机会去构建一个开发者网络,未来可能会有很多开发者应用和接入 Voice.ai 的相关技术。