AI採用ツールの精度が期待より低い場合、90%はデータの問題だ。

AI採用ツールの性能を左右するのは「データの質」という当たり前の話

思考版1 AI執筆

「AI採用ツールを導入したが、スコアが信頼できない」という相談は多い。

このほとんどは、AIの性能ではなくデータの問題だ。

AI採用ツールは、過去のデータを学習してスコアを出す。学習データが正確でなければ、スコアは意味を持たない。


データの問題:3つのパターン

パターン1:過去データに「なぜ採用したか」が記録されていない

多くの企業の採用履歴には「採用した人の名前と入社日」は記録されているが、「なぜその人を採用したか」が記録されていない。

面接評価シートが残っている企業でも、「この候補者のどの点が決め手だったか」という情報は担当者の記憶の中にある。

AIがこのデータを学習すると「採用された人の特徴」は学べるが、「なぜ採用されたか」は学べない。結果として、表面的な特徴(例:特定の大学出身、特定のキーワードが書いてある)に過剰適合するリスクがある。

パターン2:採用基準が変わっているのに過去データを使い続ける

企業の採用基準は、事業の変化・組織の成熟度・競合環境によって変わる。

3年前は「即戦力のみ採用」だったが、現在は「ポテンシャル採用も拡大」している場合、3年前のデータで学習したAIは、ポテンシャル人材を低くスコアリングする。

「AI採用ツールが保守的すぎる」という感覚は、このデータのずれから来ることが多い。

パターン3:活躍データが入力されていない

AI採用ツールの中には、採用後の活躍データを学習に使えるものがある。「入社後○年で管理職になった人」「離職率が低い採用チャネル」を学習することで、精度が上がる仕組みだ。

ただし、活躍データを採用システムと連携している企業は少ない。人事評価はHRシステムに入っているが、採用ATSと連携されていない。学習に使われるのは採用時のデータのみで、活躍との相関が取れない。


データ品質を上げるための実践的な手順

ステップ1:採用理由の言語化

採用を決定した時、「なぜ採用するか」を1〜3行で記録する習慣を作る。

例:

  • NG:「面接で好印象だったため」
  • OK:「前職でのプロジェクトマネジメント経験が自社の課題(リリーススピードの改善)に直結する。コミュニケーション面では懸念なし。」

この記録が積み上がると、「自社が採用する人の共通パターン」が言語化される。これがAI学習の材料になる。

ステップ2:不採用理由の記録

採用と同様に、不採用理由も記録する。

不採用理由が「印象が悪かった」だけでは、AIは何も学べない。「職務要件(○○)との適合度が低いと判断」という形で、基準と照らした理由を残す。

ステップ3:活躍指標の定義

AI採用ツールに活躍データを学習させる場合、「何が活躍か」を先に定義する必要がある。

例:

  • 入社後1年以内の自己都合離職
  • 入社後2年以内の昇格
  • 直属マネージャーの評価スコア(3段階)

「活躍」の定義は企業によって異なる。AI採用ツールのベンダーに「活躍をどう定義しますか」と聞かれた時に答えられるよう、事前に社内で決めておく。


小さく始められること

データ品質の整備は時間がかかる。だが、今日から始められることがある。

直近3ヶ月の採用決定を振り返り、「採用理由が記録されているか」を確認する。記録がない場合、担当者にヒアリングして5〜10件分だけでも記録する。

これが最初のデータ資産になる。

今日渡せるもの: 次の採用決定を出す時、理由を1〜3行でATSまたはスプレッドシートに残す。この積み上げが、AI採用ツールの精度を決める。


関連記事