🇯🇵 日本語 🇬🇧 English 🇨🇳 中文 🇲🇾 Bahasa Melayu

决定AI成败的关键:实践“数据管理”

生成式AI“理所当然”被颠覆的时刻

是否有经营者开始在公司内部使用ChatGPT或Claude后,感觉并未达到预期的效果?尝试自动化处理客户咨询,却因精度低下,最终仍需人工复核,徒增重复劳动。委托其总结公司内部文件,关键数字和条件却又遗漏。许多企业仅仅触及了生成式AI“便利性”的表面,并未意识到根本性问题。

日立制作所提倡的“AI就绪”概念,正是针对这一课题的明确解答。他们指出,决定生成式AI回答精度的最大因素是“数据管理”。即使引入了优秀的AI模型,如果输入的数据未经整理,输出质量也无法提升。这也是我亲身协助超过38家客户导入AI的经验中,深切体会到的事实。

本文将聚焦于“数据管理”,为经营者和CTO们解析如何将公司数据转变为“AI可利用状态”的具体方法。并非从技术理论,而是从经营决策与投资回报率的角度,传达应立即着手实践的步骤。

“AI就绪”的本质在于数据的质量与结构

日立制作所的主张非常明确。生成式AI的性能,不仅取决于模型本身的能力,更在很大程度上依赖于用于学习和推理的数据的“质量”与“管理状态”。换言之,无论搭载了多么高性能的AI引擎,如果汽油(数据)不纯,且供应系统(数据管理)不完善,汽车也无法发挥其本来的性能。

许多企业常犯的错误是,首先从签订AI工具(如ChatGPT Enterprise或Claude Team等)的合同开始。但这就像盖房子时,先挑选高级家具,之后才考虑布局和地基工程。在数据环境这一基础尚未完善的情况下导入AI,会显著降低投资回报率。

在我的咨询案例中,某制造业客户导入了客户咨询自动应答AI,但过去的咨询数据却以PDF、邮件、纸质传真、Excel等多种形式分散保存。在未解决这种“数据孤岛”状态的情况下就让AI学习,导致回答缺乏一致性,最终只是让现有的业务流程变得更加复杂。事后着手整理数据,花费了超过AI导入成本两倍以上的时间和费用。

数据管理决定ROI

作为经营者,最关心的莫过于成本效益。对数据管理的投资,乍看之下不起眼且直接成果难以显现,因此容易被搁置。然而,正是对此处的投资,决定了此后所有AI应用的ROI。

以我司为例,在SNS自动发布、WordPress文章生成、合同审查等29个业务领域活用AI,实现了每年1,550小时的工时削减(ROI 2,989%)。其基础是在初期阶段花费约80小时进行的“数据标准化”作业。统一了因业务而异的数据格式,整理了访问权限,明确了更新流程。如果没有这项投资,后续的自动化流水线构建将无法实现。

完善数据管理,不仅仅是AI应用的前期准备。它本身就是提升公司内部信息资产价值、消除个人依赖、提高决策速度的“经营基础强化”。

经营者应立即开始的3项数据管理实践

那么,具体应该从何入手呢?在此介绍无需大规模IT投资或雇佣专家,从明天起即可着手实践的三个步骤。

步骤1:数据的“库存调查”与优先级排序

首先,把握公司内部存在哪些数据,以及它们处于何种状态。一开始就进行全公司范围的盘点会很困难,因此最初应聚焦于“预计通过AI化效果最高的一个业务”。

例如,如果目标是实现客户咨询邮件的自动化,那么对象就是过去的咨询邮件及其回复、应对手册、FAQ集、产品规格书等。列出这些数据分散在何处、以何种形式存在,比如Outlook的个人文件夹、SharePoint、部门的NAS、纸质文件等。

此时,关键不在于追求“完美”。从最近一年的数据开始,只要能涵盖代表性模式就足够了。这项调查离不开对各关键岗位人员的访谈。经营者亲自明确传达“希望通过AI来优化这项业务,为此需要整理数据”的目的,更容易获得现场的配合。

步骤2:数据的“AI化转换”与标准化

掌握了数据的所在位置后,接下来就是将其转换为AI易于学习和处理的格式。这里的关键词是“结构化”和“添加元数据”。

不要将非结构化数据(邮件正文、PDF内容)直接丢给AI,而是按照一定的格式进行整理。例如,对于客户咨询邮件,提取“咨询日期时间”、“客户ID”、“咨询类别(订单/投诉/咨询)”、“正文”、“负责人员”、“解决状态标记”等项目,汇总成表格形式(CSV或Excel)。

这项工作看似麻烦,但生成式AI本身在这里就能发挥作用。我利用Claude Code,在几小时内就创建了脚本,用于解析各种格式的邮件日志,并自动提取结构化数据。像这样,数据整理工作本身,也可以通过小规模的AI应用来提高效率。初期投资仅仅是每月约21,000日元(约合人民币1,000元)的AI工具费用和几天的试错时间。

步骤3:构建数据的“持续维护”机制

最重要的是,建立一种机制,将一度整理好的数据作为“流动资产”来维持。数据管理不是一次性事件,而是持续的过程。

具体而言,制定以下规则:

  • 数据创建规则:当出现新的咨询时,务必按照指定格式(例如:在CRM系统中添加特定类别标签)进行记录。
  • 更新流程:当手册或FAQ发生变更时,明确由谁、在何时之前、负责更新哪些数据。
  • 质量检查:每月一次,通过抽样验证AI生成回答的精度,判断精度下降是否源于数据过时。

构建这种机制,成功的关键在于不仅要让IT部门参与,更要让实际使用这些数据的现场部门负责人参与进来。需要让他们认识到,数据管理不是“自上而下的强制要求”,而是“为减轻自身工作负担而进行的基础建设”。

案例研究:东京电力EP的邮件应对优化所揭示的

开头介绍的Virtualex公司为东京电力能源伙伴(EP)实施的案例,是证明这种数据管理重要性的绝佳例子。他们并非简单地导入了“邮件自动回复AI”。

仔细阅读报道会发现,他们所做的是“业务流程优化”。他们很可能对无数的咨询模式进行了分类,并构建了将相应合适的回复文本、相关条款、过去的类似案例等关联起来的“知识库”。在此基础上,构建了将收到的邮件与该知识库进行比对,生成并建议最佳回复的AI系统。

这个“知识库”的构建,正是数据管理的核心。AI只有在接触到经过整理、相互关联的高质量数据时,才能发挥出对业务有用的精度。可以说,东京电力EP的案例之所以成功,正是因为它将AI项目视为“业务与数据的重新设计”,而非单纯的“技术导入”。

着眼于“国产AI”时代的数据战略

软银、NEC、索尼、本田联合开发国产AI基础模型的新闻,将进一步提升数据管理的重要性。与OpenAI的GPT或Anthropic的Claude这类通用模型不同,预计国产模型将专门针对日本的商业惯例、法律法规、语言(敬语和行业术语)进行优化。

这是一个巨大的机遇。如果公司数据已得到完善,处于“AI就绪”状态,那么当这款国产AI模型发布时,就能率先构建出针对自身业务的高精度AI代理。反之,数据未得到整理的企业,将不得不再次从整理工作开始,从而在竞争中落后。

国产AI的出现,不仅仅是“工具选择增多”的问题。它是公司数据资产价值将比以往任何时候都更加凸显的“范式转变”前兆。经营者们需要从现在开始,制定关于如何培育、管理和利用自身数据的战略,这比选择AI模型更为重要。

总结:数据管理是最好的AI投资

成功导入生成式AI的最短路径,不是追逐最新模型,而是夯实脚下的数据环境。日立制作所倡导的通往“AI就绪”之路,正是脚踏实地的数据管理实践。

应着手的是从数据库存调查开始的三个步骤。这项投资不会立刻产生肉眼可见的成果。然而,这是为所有AI应用培育肥沃土壤、最具成本效益的投资。当公司的信息资产以“AI可利用的形式”得到完善时,生成式AI才能首次发挥其承诺的力量,成为从根本上改变经营可复制性与扩展性的利器。

数据管理,不能完全丢给技术部门。它是始于理解“信息本身就是现代经营资源”的经营者的领导力,是最重要的经营决策之一。

评论

标题和URL已复制