AI承担人事评估“运营”的时代已至
人事评估是许多企业中“应定期开展的重要工作”,但其运营容易流于形式、过度依赖个人。评估标准不一、评估者负担重、反馈质量参差不齐——这些课题长期悬而未决。
近日发布的新服务为这一现状投下了一颗石子。这就是利用生成式AI,将人事评估变为“可运营状态”的“AI人事评估JobOper(R)”。这则新闻的核心并非“AI‘代行’评估”,而在于AI将评估流程“结构化至可运营状态并持续推动”。
这已超越了单纯业务效率工具的范畴。可以说,这是一个标志性案例,表明AI开始介入“组织设计”本身,并承担起确保其可复制性与可持续性的角色。
“评估标准客观化”——AI的本质优势
传统人事评估系统引入的最大障碍是什么?那就是将标准化的评估流程根据“自身公司语境”进行定制并持续运营的难度。许多SaaS型人事评估工具提供了优秀的“框架”,但其内核(评估标准的具体化、评估文本的撰写、反馈质量)最终仍需依赖人力。
此次AI人事评估服务的突破性在于,AI深度参与了这一“内核”的生成与运营支持。具体而言,预计将支持以下流程。
评估项目的具体化与文本生成
将“领导力”“沟通能力”等抽象评估项目,转化为基于实际业务行为的具体描述(例如:“及早察觉项目延期风险,并实施了面向相关方的访谈”),这项工作给评估者带来巨大负担。生成式AI能够将公司定义的能力要求与员工的实际业绩(例如,业务报告书或项目管理工具的记录)相关联,提出适合评估的具体事例或文本建议。
将“领导力”“沟通能力”等抽象评估项目,转化为基于实际业务行为的具体描述(例如:“及早察觉项目延期风险,并实施了面向相关方的访谈”),这项工作给评估者带来巨大负担。生成式AI能够将公司定义的能力要求与员工的实际业绩(例如,业务报告书或项目管理工具的记录)相关联,提出适合评估的具体事例或文本建议。
减轻偏见与确保一致性
人为评估难免会掺杂近因效应(近期印象更深刻)或相似性偏见(对与自己相似的下属评价更高)。AI基于整个评估期间的数据,按照一定标准生成评估文本,因此有望减轻这类无意识的偏见。它可以作为全公司范围内保持评估“标尺”统一的、事实上的“基准器”。
经营课题从“效率化”转向“再设计”
让我们从我们所倡导的“摆脱SaaS依赖”这一语境来重新审视这一动向。传统的人事评估SaaS是出租“评估框架”这一“空壳”的商业模式。企业支付高昂的许可费,但关键的运营负荷和依赖个人的风险却依然留在公司内部。
基于AI平台的方法改变了这一结构。它指明了将公司持有的“评估哲学”或“期望人才形象”这一核心(内核)嵌入AI引擎,并将运营本身半自动化的路径。这更接近于一种思维方式:不是借用SaaS这种“成品”,而是将公司核心部分作为“由AI驱动的机制”进行内部构建。
实际上,作为本媒体运营者的笔者所在公司,也已开始尝试将评估和目标管理(OKR)的进度确认,在一定程度上委托给与Slack联动的AI智能体。由AI收集、汇总每周进度报告,分析其与目标的偏差,并在必要时向管理者发出提醒。这种“运营自动化”,仅靠购买评估“框架”是无法实现的。
迈向实践的第一步:从公司内部启动“评估AI化”
在直接引入专用服务之前,利用公司自身资源能做到哪一步?以下是面向经营者或后台部门负责人,建议进行验证的具体且现实的第一步。
步骤1:评估标准的“语言化”与“结构化”
首先,将现行的评估制度整理成AI能够理解的形式。不是直接将评估表输入AI,而是以表格形式汇总“评估项目”“定义”“具体期望行为(示例)”“评估尺度(1~5级的定义)”。这项工作本身就有助于发现评估标准的模糊之处。成本仅为整理工作所需的人工。
步骤2:利用生成式AI进行评估文本的“草稿生成”
活用ChatGPT或Claude等通用生成式AI。评估者(管理者)将下属的具体成果或事例(例如:“在A项目中,应对了客户突如其来的规格变更,并守住了交付期限”)以简单的要点形式输入。向AI提供事先整理好的评估标准定义作为提示,让其生成诸如“该事例符合‘问题解决能力’的4级水平。可考虑如下评估文本”的草稿。评估者可在此基础上,添加更具个性化的反馈。月度成本方面,即使使用GPT-4等高功能模型,每用户也仅需数千日元(约合人民币数百元)起。
步骤3:保障反馈“质量”的AI检查
作为最终步骤,也可以利用AI分析评估者撰写的反馈文本。依据事先设定的指南,检查“该反馈是否基于具体行为”“是否包含改进建议”“是否存在过度否定性表达”等。由此,可以提升反馈质量的底线并使其均衡化。
活用补贴与内部构建的平衡
作为相关新闻,AI基础平台被认定为“数字化·AI引进补贴”的适用工具也值得关注。这意味着国家正在推动AI“基础”本身的引进。
对于经营者的判断而言,重要的是选择“利用补贴引进外部服务”,还是“利用补贴强化公司自身的AI基础(如数据联动平台等),并在此基础上谋求评估系统的内部构建”。后一条道路看似门槛较高,但随着代码生成AI(Claude Code、GitHub Copilot等)的发展,它已成为比以往现实得多的选择。
不仅限于人事评估,经营管理、销售支持、客户应对等所有业务流程都是“设计→运营→改善”的循环。AI的真正价值在于降低这一循环中“运营”部分的负荷,创造一个人能够专注于“设计”与“改善”这类更具创造性、战略性业务的环境。
结论:AI将人事从“管理”升华至“设计”
AI人事评估服务的出现,清晰地表明AI应用正从单纯的“作业自动化”向“业务流程本身的再设计”阶段过渡。
对于AI介入人事评估这一关乎企业文化根基的领域,或许存在谨慎论调。然而,AI承担的,终究是人类不擅长且感到负担的部分,即“基于既定标准的、公平且持续的运营”。评估的“哲学”以及最终的“判断”,依然掌握在人类手中。
经营者和CTO现在应该思考的,或许不是“选择哪款AI评估工具”,而是“借助AI的力量,如何重新设计我公司的人事制度与组织运营,使其更坚固、更可持续”这一根本性问题。其第一步,始于将公司评估标准语言化,并用现有生成式AI进行试验的小小实践。


评论