声音改变AI经营，8300人揭示的未来

8300名伙伴用声音使用AI的时代

GMO互联网集团于2025年7月启动了新项目。这项名为“Project Whisper for AI by GMO”的举措，旨在为集团全体约8300名伙伴提供“用声音使用AI”的环境。

乍看之下，这似乎只是引入了一个内部工具。然而，在经营者眼中，这应被视为“AI应用民主化”的一个重要转折点。

原因在于，此前阻碍AI工具普及的最大障碍是“操作的繁琐性”。对于不擅长键盘输入或不熟悉电脑操作的现场员工来说，ChatGPT和Claude等基于文本的AI门槛较高。语音输入则有望一举消除这一障碍。

我本人每天在工作中使用Claude Code和ChatGPT，切实感受到文本输入与语音输入在思维质量上的差异。打字时思维容易中断，而语音则能将脑海中的想法直接抛给AI。

尤其对经营现场而言，以下三点至关重要。

语音输入的速度约为打字的3至4倍。会议纪要的整理、创意的头脑风暴、给客户的回复草稿——这些工作都将大幅缩短时间。

即使是不熟悉电脑操作的老员工或主要从事现场作业的人员，只需按下智能手机的麦克风按钮并说话，即可使用AI。GMO能同时向8300名伙伴推广，正是得益于这种低门槛。

即使在无法脱手的工作中，也能仅凭声音向AI下达指令。工厂流水线作业、销售出差途中、餐厅烹饪期间——语音AI能够引入到此前难以应用AI的现场。

经营者最关心的莫过于成本。GMO的案例虽面向大企业，但中小企业同样可以充分引入类似的机制。

以下列举几个具体选项。

ChatGPT应用标配语音输入功能，月费20美元（约合人民币140元）的Plus套餐即可使用。Claude应用也类似。这是成本最低的入门方式。

专注于会议纪要的“Notta”和“AI GIJIROKU”、专注于销售支持的“Salesforce Einstein”等，针对不同业务的专业服务也在增加。月费约5000日元至2万日元（约合人民币250元至1000元）即可导入。

利用语音识别API（如Google Speech-to-Text或Whisper），可以构建针对自身业务优化的语音AI系统。初期开发费用在数十万至数百万日元（约合人民币数万元至数十万元），但长期来看，具有摆脱对SaaS依赖的优势。

然而，语音AI也存在课题。经营者应在导入前掌握以下要点。

语音数据可能比文本包含更多机密信息。在GMO的案例中，语音数据的处理想必也极为谨慎。必须完善公司内部规定，并确认所使用的服务如何处理数据。

具体而言，请确认以下几点。

日语的语音识别精度逐年提升，但在专业术语、专有名词和方言方面可能较弱。建议在导入前，使用公司业务中涉及的术语进行测试。

就我而言，法律术语和合同中的专业词汇最初未能准确识别，初期颇费周折。对策是选择具备自定义词典功能的服务，或建立定期反馈的机制。

用声音向AI下达指令的方式尚不普遍。尤其在日本，不少员工对“出声工作”抱有抵触情绪。导入前，共享公司内部的使用规则和礼仪，并采取逐步渗透的策略至关重要。

GMO的案例不仅仅是工具导入。为8300名伙伴提供语音使用AI的环境，是一项提升整个组织“AI素养”的举措。

经营者应思考以下问题。

“本公司的员工，是否正被‘操作壁垒’所阻碍，无法充分利用AI？”

如果AI的应用仅局限于少数IT素养较高的员工，那么语音输入便是消除这一壁垒的有效手段。

根据我的经验，AI应用的效果与“使用人数”成正比。与其让一名超级用户每月节省100小时，不如让100名普通用户每人每月节省1小时，这更能提升整个组织的生产力。

语音AI正是加速后者——“普通用户普及”的工具。

GMO的“Project Whisper”展示了AI应用的新阶段：从“能用AI的人”向“任何人都能用AI”的转变。

作为经营者，我建议立即采取以下三项行动。

语音AI仍是一项刚刚起步的技术。然而，像GMO这样的大企业积极导入，证明这一趋势是真实的。趁现在体验并找到适合自身公司的导入方法，将是构筑竞争优势的关键。