决定AI成败的关键：实践“数据管理”

生成式AI“理所当然”被颠覆的时刻
“AI就绪”的本质在于数据的质量与结构
1. 数据管理决定ROI
经营者应立即开始的3项数据管理实践
案例研究：东京电力EP的邮件应对优化所揭示的
着眼于“国产AI”时代的数据战略
总结：数据管理是最好的AI投资

生成式AI“理所当然”被颠覆的时刻

是否有经营者开始在公司内部使用ChatGPT或Claude后，感觉并未达到预期的效果？尝试自动化处理客户咨询，却因精度低下，最终仍需人工复核，徒增重复劳动。委托其总结公司内部文件，关键数字和条件却又遗漏。许多企业仅仅触及了生成式AI“便利性”的表面，并未意识到根本性问题。

日立制作所提倡的“AI就绪”概念，正是针对这一课题的明确解答。他们指出，决定生成式AI回答精度的最大因素是“数据管理”。即使引入了优秀的AI模型，如果输入的数据未经整理，输出质量也无法提升。这也是我亲身协助超过38家客户导入AI的经验中，深切体会到的事实。

本文将聚焦于“数据管理”，为经营者和CTO们解析如何将公司数据转变为“AI可利用状态”的具体方法。并非从技术理论，而是从经营决策与投资回报率的角度，传达应立即着手实践的步骤。

“AI就绪”的本质在于数据的质量与结构

日立制作所的主张非常明确。生成式AI的性能，不仅取决于模型本身的能力，更在很大程度上依赖于用于学习和推理的数据的“质量”与“管理状态”。换言之，无论搭载了多么高性能的AI引擎，如果汽油（数据）不纯，且供应系统（数据管理）不完善，汽车也无法发挥其本来的性能。

许多企业常犯的错误是，首先从签订AI工具（如ChatGPT Enterprise或Claude Team等）的合同开始。但这就像盖房子时，先挑选高级家具，之后才考虑布局和地基工程。在数据环境这一基础尚未完善的情况下导入AI，会显著降低投资回报率。

在我的咨询案例中，某制造业客户导入了客户咨询自动应答AI，但过去的咨询数据却以PDF、邮件、纸质传真、Excel等多种形式分散保存。在未解决这种“数据孤岛”状态的情况下就让AI学习，导致回答缺乏一致性，最终只是让现有的业务流程变得更加复杂。事后着手整理数据，花费了超过AI导入成本两倍以上的时间和费用。

数据管理决定ROI

作为经营者，最关心的莫过于成本效益。对数据管理的投资，乍看之下不起眼且直接成果难以显现，因此容易被搁置。然而，正是对此处的投资，决定了此后所有AI应用的ROI。

以我司为例，在SNS自动发布、WordPress文章生成、合同审查等29个业务领域活用AI，实现了每年1,550小时的工时削减（ROI 2,989%）。其基础是在初期阶段花费约80小时进行的“数据标准化”作业。统一了因业务而异的数据格式，整理了访问权限，明确了更新流程。如果没有这项投资，后续的自动化流水线构建将无法实现。

完善数据管理，不仅仅是AI应用的前期准备。它本身就是提升公司内部信息资产价值、消除个人依赖、提高决策速度的“经营基础强化”。

经营者应立即开始的3项数据管理实践

那么，具体应该从何入手呢？在此介绍无需大规模IT投资或雇佣专家，从明天起即可着手实践的三个步骤。

步骤1：数据的“库存调查”与优先级排序

首先，把握公司内部存在哪些数据，以及它们处于何种状态。一开始就进行全公司范围的盘点会很困难，因此最初应聚焦于“预计通过AI化效果最高的一个业务”。

例如，如果目标是实现客户咨询邮件的自动化，那么对象就是过去的咨询邮件及其回复、应对手册、FAQ集、产品规格书等。列出这些数据分散在何处、以何种形式存在，比如Outlook的个人文件夹、SharePoint、部门的NAS、纸质文件等。

此时，关键不在于追求“完美”。从最近一年的数据开始，只要能涵盖代表性模式就足够了。这项调查离不开对各关键岗位人员的访谈。经营者亲自明确传达“希望通过AI来优化这项业务，为此需要整理数据”的目的，更容易获得现场的配合。

步骤2：数据的“AI化转换”与标准化

掌握了数据的所在位置后，接下来就是将其转换为AI易于学习和处理的格式。这里的关键词是“结构化”和“添加元数据”。

不要将非结构化数据（邮件正文、PDF内容）直接丢给AI，而是按照一定的格式进行整理。例如，对于客户咨询邮件，提取“咨询日期时间”、“客户ID”、“咨询类别（订单/投诉/咨询）”、“正文”、“负责人员”、“解决状态标记”等项目，汇总成表格形式（CSV或Excel）。

这项工作看似麻烦，但生成式AI本身在这里就能发挥作用。我利用Claude Code，在几小时内就创建了脚本，用于解析各种格式的邮件日志，并自动提取结构化数据。像这样，数据整理工作本身，也可以通过小规模的AI应用来提高效率。初期投资仅仅是每月约21,000日元（约合人民币1,000元）的AI工具费用和几天的试错时间。

步骤3：构建数据的“持续维护”机制

最重要的是，建立一种机制，将一度整理好的数据作为“流动资产”来维持。数据管理不是一次性事件，而是持续的过程。

具体而言，制定以下规则：

数据创建规则：当出现新的咨询时，务必按照指定格式（例如：在CRM系统中添加特定类别标签）进行记录。
更新流程：当手册或FAQ发生变更时，明确由谁、在何时之前、负责更新哪些数据。
质量检查：每月一次，通过抽样验证AI生成回答的精度，判断精度下降是否源于数据过时。

构建这种机制，成功的关键在于不仅要让IT部门参与，更要让实际使用这些数据的现场部门负责人参与进来。需要让他们认识到，数据管理不是“自上而下的强制要求”，而是“为减轻自身工作负担而进行的基础建设”。

案例研究：东京电力EP的邮件应对优化所揭示的

开头介绍的Virtualex公司为东京电力能源伙伴（EP）实施的案例，是证明这种数据管理重要性的绝佳例子。他们并非简单地导入了“邮件自动回复AI”。

仔细阅读报道会发现，他们所做的是“业务流程优化”。他们很可能对无数的咨询模式进行了分类，并构建了将相应合适的回复文本、相关条款、过去的类似案例等关联起来的“知识库”。在此基础上，构建了将收到的邮件与该知识库进行比对，生成并建议最佳回复的AI系统。

这个“知识库”的构建，正是数据管理的核心。AI只有在接触到经过整理、相互关联的高质量数据时，才能发挥出对业务有用的精度。可以说，东京电力EP的案例之所以成功，正是因为它将AI项目视为“业务与数据的重新设计”，而非单纯的“技术导入”。

着眼于“国产AI”时代的数据战略

软银、NEC、索尼、本田联合开发国产AI基础模型的新闻，将进一步提升数据管理的重要性。与OpenAI的GPT或Anthropic的Claude这类通用模型不同，预计国产模型将专门针对日本的商业惯例、法律法规、语言（敬语和行业术语）进行优化。

这是一个巨大的机遇。如果公司数据已得到完善，处于“AI就绪”状态，那么当这款国产AI模型发布时，就能率先构建出针对自身业务的高精度AI代理。反之，数据未得到整理的企业，将不得不再次从整理工作开始，从而在竞争中落后。

国产AI的出现，不仅仅是“工具选择增多”的问题。它是公司数据资产价值将比以往任何时候都更加凸显的“范式转变”前兆。经营者们需要从现在开始，制定关于如何培育、管理和利用自身数据的战略，这比选择AI模型更为重要。

总结：数据管理是最好的AI投资

成功导入生成式AI的最短路径，不是追逐最新模型，而是夯实脚下的数据环境。日立制作所倡导的通往“AI就绪”之路，正是脚踏实地的数据管理实践。

应着手的是从数据库存调查开始的三个步骤。这项投资不会立刻产生肉眼可见的成果。然而，这是为所有AI应用培育肥沃土壤、最具成本效益的投资。当公司的信息资产以“AI可利用的形式”得到完善时，生成式AI才能首次发挥其承诺的力量，成为从根本上改变经营可复制性与扩展性的利器。

数据管理，不能完全丢给技术部门。它是始于理解“信息本身就是现代经营资源”的经营者的领导力，是最重要的经营决策之一。