AI採用ツールの精度が期待より低い場合、90%はデータの問題だ。
AI採用ツールの性能を左右するのは「データの質」という当たり前の話
「AI採用ツールを導入したが、スコアが信頼できない」という相談は多い。
このほとんどは、AIの性能ではなくデータの問題だ。
AI採用ツールは、過去のデータを学習してスコアを出す。学習データが正確でなければ、スコアは意味を持たない。
データの問題:3つのパターン
パターン1:過去データに「なぜ採用したか」が記録されていない
多くの企業の採用履歴には「採用した人の名前と入社日」は記録されているが、「なぜその人を採用したか」が記録されていない。
面接評価シートが残っている企業でも、「この候補者のどの点が決め手だったか」という情報は担当者の記憶の中にある。
AIがこのデータを学習すると「採用された人の特徴」は学べるが、「なぜ採用されたか」は学べない。結果として、表面的な特徴(例:特定の大学出身、特定のキーワードが書いてある)に過剰適合するリスクがある。
パターン2:採用基準が変わっているのに過去データを使い続ける
企業の採用基準は、事業の変化・組織の成熟度・競合環境によって変わる。
3年前は「即戦力のみ採用」だったが、現在は「ポテンシャル採用も拡大」している場合、3年前のデータで学習したAIは、ポテンシャル人材を低くスコアリングする。
「AI採用ツールが保守的すぎる」という感覚は、このデータのずれから来ることが多い。
パターン3:活躍データが入力されていない
AI採用ツールの中には、採用後の活躍データを学習に使えるものがある。「入社後○年で管理職になった人」「離職率が低い採用チャネル」を学習することで、精度が上がる仕組みだ。
ただし、活躍データを採用システムと連携している企業は少ない。人事評価はHRシステムに入っているが、採用ATSと連携されていない。学習に使われるのは採用時のデータのみで、活躍との相関が取れない。
データ品質を上げるための実践的な手順
ステップ1:採用理由の言語化
採用を決定した時、「なぜ採用するか」を1〜3行で記録する習慣を作る。
例:
- NG:「面接で好印象だったため」
- OK:「前職でのプロジェクトマネジメント経験が自社の課題(リリーススピードの改善)に直結する。コミュニケーション面では懸念なし。」
この記録が積み上がると、「自社が採用する人の共通パターン」が言語化される。これがAI学習の材料になる。
ステップ2:不採用理由の記録
採用と同様に、不採用理由も記録する。
不採用理由が「印象が悪かった」だけでは、AIは何も学べない。「職務要件(○○)との適合度が低いと判断」という形で、基準と照らした理由を残す。
ステップ3:活躍指標の定義
AI採用ツールに活躍データを学習させる場合、「何が活躍か」を先に定義する必要がある。
例:
- 入社後1年以内の自己都合離職
- 入社後2年以内の昇格
- 直属マネージャーの評価スコア(3段階)
「活躍」の定義は企業によって異なる。AI採用ツールのベンダーに「活躍をどう定義しますか」と聞かれた時に答えられるよう、事前に社内で決めておく。
小さく始められること
データ品質の整備は時間がかかる。だが、今日から始められることがある。
直近3ヶ月の採用決定を振り返り、「採用理由が記録されているか」を確認する。記録がない場合、担当者にヒアリングして5〜10件分だけでも記録する。
これが最初のデータ資産になる。
今日渡せるもの: 次の採用決定を出す時、理由を1〜3行でATSまたはスプレッドシートに残す。この積み上げが、AI採用ツールの精度を決める。
関連記事
- AI採用ツールを入れる前に人事部でやるべき20のチェック — データ品質を含む導入前確認リストの全体像
- 採用でAIを使う時に必ず出る「なぜそう判断したか」問題 — データ記録がなぜ説明責任に直結するか
- Claude CodeをHRや採用データ分析に使う方法 — 蓄積した採用データをAIで分析する具体的な手順