8300名伙伴用声音使用AI的时代
GMO互联网集团于2025年7月启动了新项目。这项名为“Project Whisper for AI by GMO”的举措,旨在为集团全体约8300名伙伴提供“用声音使用AI”的环境。
乍看之下,这似乎只是引入了一个内部工具。然而,在经营者眼中,这应被视为“AI应用民主化”的一个重要转折点。
原因在于,此前阻碍AI工具普及的最大障碍是“操作的繁琐性”。对于不擅长键盘输入或不熟悉电脑操作的现场员工来说,ChatGPT和Claude等基于文本的AI门槛较高。语音输入则有望一举消除这一障碍。
语音AI改变现场的三大壁垒
我本人每天在工作中使用Claude Code和ChatGPT,切实感受到文本输入与语音输入在思维质量上的差异。打字时思维容易中断,而语音则能将脑海中的想法直接抛给AI。
尤其对经营现场而言,以下三点至关重要。
第一,速度
语音输入的速度约为打字的3至4倍。会议纪要的整理、创意的头脑风暴、给客户的回复草稿——这些工作都将大幅缩短时间。
第二,低门槛
即使是不熟悉电脑操作的老员工或主要从事现场作业的人员,只需按下智能手机的麦克风按钮并说话,即可使用AI。GMO能同时向8300名伙伴推广,正是得益于这种低门槛。
第三,与多任务处理的兼容性
即使在无法脱手的工作中,也能仅凭声音向AI下达指令。工厂流水线作业、销售出差途中、餐厅烹饪期间——语音AI能够引入到此前难以应用AI的现场。
现实考量导入成本与障碍
经营者最关心的莫过于成本。GMO的案例虽面向大企业,但中小企业同样可以充分引入类似的机制。
以下列举几个具体选项。
1. 利用现有AI工具的语音输入功能
ChatGPT应用标配语音输入功能,月费20美元(约合人民币140元)的Plus套餐即可使用。Claude应用也类似。这是成本最低的入门方式。
2. 业务专用型语音AI服务
专注于会议纪要的“Notta”和“AI GIJIROKU”、专注于销售支持的“Salesforce Einstein”等,针对不同业务的专业服务也在增加。月费约5000日元至2万日元(约合人民币250元至1000元)即可导入。
3. 自研选项
利用语音识别API(如Google Speech-to-Text或Whisper),可以构建针对自身业务优化的语音AI系统。初期开发费用在数十万至数百万日元(约合人民币数万元至数十万元),但长期来看,具有摆脱对SaaS依赖的优势。
导入语音AI需注意的三个要点
然而,语音AI也存在课题。经营者应在导入前掌握以下要点。
隐私与安全
语音数据可能比文本包含更多机密信息。在GMO的案例中,语音数据的处理想必也极为谨慎。必须完善公司内部规定,并确认所使用的服务如何处理数据。
具体而言,请确认以下几点。
- 语音数据是否用于学习
- 数据保存期限与删除政策
- 处理禁止外带信息时的对策
语音识别精度
日语的语音识别精度逐年提升,但在专业术语、专有名词和方言方面可能较弱。建议在导入前,使用公司业务中涉及的术语进行测试。
就我而言,法律术语和合同中的专业词汇最初未能准确识别,初期颇费周折。对策是选择具备自定义词典功能的服务,或建立定期反馈的机制。
组织文化与习惯
用声音向AI下达指令的方式尚不普遍。尤其在日本,不少员工对“出声工作”抱有抵触情绪。导入前,共享公司内部的使用规则和礼仪,并采取逐步渗透的策略至关重要。
语音AI带来的经营影响
GMO的案例不仅仅是工具导入。为8300名伙伴提供语音使用AI的环境,是一项提升整个组织“AI素养”的举措。
经营者应思考以下问题。
“本公司的员工,是否正被‘操作壁垒’所阻碍,无法充分利用AI?”
如果AI的应用仅局限于少数IT素养较高的员工,那么语音输入便是消除这一壁垒的有效手段。
根据我的经验,AI应用的效果与“使用人数”成正比。与其让一名超级用户每月节省100小时,不如让100名普通用户每人每月节省1小时,这更能提升整个组织的生产力。
语音AI正是加速后者——“普通用户普及”的工具。
总结:下一步如何行动
GMO的“Project Whisper”展示了AI应用的新阶段:从“能用AI的人”向“任何人都能用AI”的转变。
作为经营者,我建议立即采取以下三项行动。
- 首先亲自尝试:即使只有一周,也请在日常工作中使用ChatGPT或Claude应用的语音输入功能。亲身体验是最好的判断依据。
- 考虑试点导入:在特定部门或团队中试验性导入语音AI工具,并衡量效果。从会议纪要整理或日报填写等定型业务入手较为稳妥。
- 完善公司内部规则:制定明确语音数据处理、使用范围及禁止事项的指南。平衡安全性与便利性至关重要。
语音AI仍是一项刚刚起步的技术。然而,像GMO这样的大企业积极导入,证明这一趋势是真实的。趁现在体验并找到适合自身公司的导入方法,将是构筑竞争优势的关键。

评论