PROTOCOL 005 · FOR CHRO

AI採用ツール導入後の90日間でやるべきこと

TIME 90 days STEPS 4 2026.07.03

OVERVIEW (machine-readable)

SITUATION: AIツールを入れた（または入れようとしている）が、現場に定着する前に止まりそう
GOAL: 90日で実績データ・評価基準・運用責任者の3点を揃え、AIを判断の相棒にする
PREREQ: ATSなどに過去2〜3年分の応募データがある / 先行運用する採用担当者を1〜2名確保できる
PITFALL: いきなり全部を任せようとして止まる、または全職種へ一斉展開すると事故る

「ツールは入れました。でも、まだ誰も使っていません」——顧問先でいちばん多く聞く報告がこれだ。契約は済み、ログイン画面までは開く。そこから数ヶ月、AIは一度も採用判断の隣に座っていない。

理由はだいたい同じで、「いきなり全部を任せようとして、こわくなって止まる」。AIは入れた瞬間に戦力になる魔法ではない。最初の90日、隣で一緒に判断を重ねた回数だけ、こちらの基準を飲み込んだ相棒になる。

その90日を、止まらないように分解した。ツールをまだ選んでいない場合は、Day 1に入る前に「＿＿の業務に週＿＿時間かかり、＿＿が苦しい」を一文で埋めてから始めるといい。空欄が埋まらないなら、まだAIを入れる段階ではない。

STEP 1 — Day 1〜30：データ整備と基準の言語化

データの棚卸し

月曜の朝いちばんにやるのは、導入キックオフ会議ではない。ATSのエクスポートボタンを押すことだ。過去2〜3年分の応募データを職種別にCSVで出し、次の3つを数える。

合格・不合格のラベルが付いている行は何割か
欠損値はどのくらい混じっているか
同じ職種で、判断軸がバラバラに記録されていないか

これで初週は終わってかまわない。AIに渡せる素材があるかを先に見るからだ。ラベルが半分も付いていないなら、順番が逆になっている。AI導入より前に、データを整える方が効く。相棒に渡す前に、自分たちの記録を読める状態にする。

あわせて、採用管理システム（ATS）の候補者データが構造化されているか、過去の採用結果（内定・辞退・活躍度）が記録として残っているか、評価シートのフォーマットが統一されているかも確認する。棚卸しの結果、データが整っていなければ、AI導入より先にデータ整備が必要だという判断を、この最初の30日のうちに出す。

採用基準の言語化

採用担当者にヒアリングを行い、「この評価軸で、どのレベルを求めるか」を文書化する。

ヒアリングの問い：

直近1年で「採用すべきだった」と思う候補者は、何が他の候補者と違ったか
「採用後に期待を外れた」候補者は、面接時点で何が見えていなかったか
面接官が3人いたとして、同じ候補者を同じ観点で評価するか

現場で見ていると、この作業の本当の価値はAI導入の準備ではない。「うちは何を見て採っているのか」が初めて言葉になる点にある。AIに渡せない基準は、隣の面接官にも渡せていない。属人化が一枚ほどける。

あわせて、HR担当者全員に「週に最も時間がかかっている作業ベスト3」をヒアリングし、各作業の時間を1週間記録しておく。これがDay 31以降、どの業務で先行運用するかを選ぶ材料になる。

STEP 2 — Day 31〜60：小さいスコープで本番稼働

最小スコープの選定

全職種・全プロセスへの適用ではなく、最小スコープで本番稼働させる。

選ぶ基準：

応募数が月20〜50件程度（少なすぎず多すぎず）
採用担当者が1〜2名（変数を減らす）
採用基準が言語化できている職種
週に一定回数繰り返される（週1回以上）業務であること
判断基準が言語化でき、結果が数値で確認できること

例として選びやすいのは「JD（求人票）の初稿作成」「面接評価のコメント補助」「候補者へのメール文案作成」。

並行評価期間の設計

この1ヶ月は、AIに判断を飛ばさせない。隣に並べる。AIスコアと人間評価の両方を出し、突き合わせる期間にする。

「AIスコアを見てから人間が評価する」
「人間が評価してからAIスコアを確認する」

2パターン試すのは、どちらが実務に馴染むかを見るためだ。ここで急いで判断をAIに渡してはいけない。まだお互いの目線が揃っていない。セコンドが選手の癖を覚える前に試合を任せないのと同じだ。

AIに初稿を任せ、最後の判断は人が握る——相棒に下書きを渡してもらい、決めるのは自分、という役割分担を最初から崩さない。担当者は1〜2名に絞り、使った回数・時間短縮・品質の変化をメモで記録する。

STEP 3 — Day 61〜90：比較結果の分析と閾値の調整

比較結果の分析

並行評価期間の結果を確認する。

いちばん学びがあるのは、一致した候補者ではなく、AIと人間で評価が割れた候補者だ。

AIスコアが高く、人間評価も高い：基準が噛み合っているゾーン
AIスコアは高いが、人間評価は低い：AIが拾っている何かと、採用基準のズレ
AIスコアは低いが、人間評価は高い：AIが見落としている、言葉にできていなかった目線

割れた理由を一件ずつ言葉にする。これはAIを直す作業に見えて、半分は自分たちの基準を直す作業だ。

閾値の調整

最初から「AIスコアが低い候補者を自動で落とす」設定にしてはいけない。まだ実績がないのに線を引くと、その線がどこかで人を取りこぼしても、誰も気づけない。

最低でも90日。「このスコア以下は確実に採れない」と実績で言い切れる状態になってから、初めて一部を任せる。判断をいきなり丸ごと飛ばすのではなく、確かめた範囲だけ一つずつ渡していく。

STEP 4 — 90日後：定着させ、よくある失敗を避ける

90日後にやっておくべきこと：

AIが処理した候補者のサンプルを、月1回いっしょに見直す仕組みを作る
運用責任者を1名決める（AIの判断を誰も見ていない状態を作らない）
採用基準の見直しを定例にする（年2回以上）

最初の90日で「実績データ」「評価基準」「運用責任者」の3つが揃えば、AIはもう試用中のツールではなく、基準を共有した相棒になっている。

他の担当者・他職種へ横展開する時は、マニュアルを作る前に「口頭で使い方を教える」ことを先にする（マニュアル作成に時間をかけすぎない）。使い方に個人差が出ることを前提にし、統一ルールを出すのは横展開の後半でいい。横展開した後は、最初に特定した問題が解決されたか、AIを使い始めて新たに見えてきた問題は何か、次に取り組む業務候補は何かを確認する。

よくある失敗と対策：

失敗	原因	対策
ツールが使われなくなる	担当者が使い方を知らない	1〜2名に絞って深く伴走する
効果が測れない	測定指標を決めていなかった	最初の週に「現在の時間」を記録する
展開が遅い	全員に一斉展開しようとした	1〜2名→チーム→全体の段階的展開にする
ツール変更が必要になる	最初の問題特定が曖昧だった	「何の業務の何が問題か」まで具体化する

任せきりにするためではない。隣で長く一緒に判断していくための土台だ。