AI採用ツール導入後の90日間でやるべきこと
- SITUATION: AIツールを入れた(または入れようとしている)が、現場に定着する前に止まりそう
- GOAL: 90日で実績データ・評価基準・運用責任者の3点を揃え、AIを判断の相棒にする
- PREREQ: ATSなどに過去2〜3年分の応募データがある / 先行運用する採用担当者を1〜2名確保できる
- PITFALL: いきなり全部を任せようとして止まる、または全職種へ一斉展開すると事故る
「ツールは入れました。でも、まだ誰も使っていません」——顧問先でいちばん多く聞く報告がこれだ。契約は済み、ログイン画面までは開く。そこから数ヶ月、AIは一度も採用判断の隣に座っていない。
理由はだいたい同じで、「いきなり全部を任せようとして、こわくなって止まる」。AIは入れた瞬間に戦力になる魔法ではない。最初の90日、隣で一緒に判断を重ねた回数だけ、こちらの基準を飲み込んだ相棒になる。
その90日を、止まらないように分解した。ツールをまだ選んでいない場合は、Day 1に入る前に「__の業務に週__時間かかり、__が苦しい」を一文で埋めてから始めるといい。空欄が埋まらないなら、まだAIを入れる段階ではない。
STEP 1 — Day 1〜30:データ整備と基準の言語化
データの棚卸し
月曜の朝いちばんにやるのは、導入キックオフ会議ではない。ATSのエクスポートボタンを押すことだ。過去2〜3年分の応募データを職種別にCSVで出し、次の3つを数える。
- 合格・不合格のラベルが付いている行は何割か
- 欠損値はどのくらい混じっているか
- 同じ職種で、判断軸がバラバラに記録されていないか
これで初週は終わってかまわない。AIに渡せる素材があるかを先に見るからだ。ラベルが半分も付いていないなら、順番が逆になっている。AI導入より前に、データを整える方が効く。相棒に渡す前に、自分たちの記録を読める状態にする。
あわせて、採用管理システム(ATS)の候補者データが構造化されているか、過去の採用結果(内定・辞退・活躍度)が記録として残っているか、評価シートのフォーマットが統一されているかも確認する。棚卸しの結果、データが整っていなければ、AI導入より先にデータ整備が必要だという判断を、この最初の30日のうちに出す。
採用基準の言語化
採用担当者にヒアリングを行い、「この評価軸で、どのレベルを求めるか」を文書化する。
ヒアリングの問い:
- 直近1年で「採用すべきだった」と思う候補者は、何が他の候補者と違ったか
- 「採用後に期待を外れた」候補者は、面接時点で何が見えていなかったか
- 面接官が3人いたとして、同じ候補者を同じ観点で評価するか
現場で見ていると、この作業の本当の価値はAI導入の準備ではない。「うちは何を見て採っているのか」が初めて言葉になる点にある。AIに渡せない基準は、隣の面接官にも渡せていない。属人化が一枚ほどける。
あわせて、HR担当者全員に「週に最も時間がかかっている作業ベスト3」をヒアリングし、各作業の時間を1週間記録しておく。これがDay 31以降、どの業務で先行運用するかを選ぶ材料になる。
STEP 2 — Day 31〜60:小さいスコープで本番稼働
最小スコープの選定
全職種・全プロセスへの適用ではなく、最小スコープで本番稼働させる。
選ぶ基準:
- 応募数が月20〜50件程度(少なすぎず多すぎず)
- 採用担当者が1〜2名(変数を減らす)
- 採用基準が言語化できている職種
- 週に一定回数繰り返される(週1回以上)業務であること
- 判断基準が言語化でき、結果が数値で確認できること
例として選びやすいのは「JD(求人票)の初稿作成」「面接評価のコメント補助」「候補者へのメール文案作成」。
並行評価期間の設計
この1ヶ月は、AIに判断を飛ばさせない。隣に並べる。AIスコアと人間評価の両方を出し、突き合わせる期間にする。
- 「AIスコアを見てから人間が評価する」
- 「人間が評価してからAIスコアを確認する」
2パターン試すのは、どちらが実務に馴染むかを見るためだ。ここで急いで判断をAIに渡してはいけない。まだお互いの目線が揃っていない。セコンドが選手の癖を覚える前に試合を任せないのと同じだ。
AIに初稿を任せ、最後の判断は人が握る——相棒に下書きを渡してもらい、決めるのは自分、という役割分担を最初から崩さない。担当者は1〜2名に絞り、使った回数・時間短縮・品質の変化をメモで記録する。
STEP 3 — Day 61〜90:比較結果の分析と閾値の調整
比較結果の分析
並行評価期間の結果を確認する。
いちばん学びがあるのは、一致した候補者ではなく、AIと人間で評価が割れた候補者だ。
- AIスコアが高く、人間評価も高い:基準が噛み合っているゾーン
- AIスコアは高いが、人間評価は低い:AIが拾っている何かと、採用基準のズレ
- AIスコアは低いが、人間評価は高い:AIが見落としている、言葉にできていなかった目線
割れた理由を一件ずつ言葉にする。これはAIを直す作業に見えて、半分は自分たちの基準を直す作業だ。
閾値の調整
最初から「AIスコアが低い候補者を自動で落とす」設定にしてはいけない。まだ実績がないのに線を引くと、その線がどこかで人を取りこぼしても、誰も気づけない。
最低でも90日。「このスコア以下は確実に採れない」と実績で言い切れる状態になってから、初めて一部を任せる。判断をいきなり丸ごと飛ばすのではなく、確かめた範囲だけ一つずつ渡していく。
STEP 4 — 90日後:定着させ、よくある失敗を避ける
90日後にやっておくべきこと:
- AIが処理した候補者のサンプルを、月1回いっしょに見直す仕組みを作る
- 運用責任者を1名決める(AIの判断を誰も見ていない状態を作らない)
- 採用基準の見直しを定例にする(年2回以上)
最初の90日で「実績データ」「評価基準」「運用責任者」の3つが揃えば、AIはもう試用中のツールではなく、基準を共有した相棒になっている。
他の担当者・他職種へ横展開する時は、マニュアルを作る前に「口頭で使い方を教える」ことを先にする(マニュアル作成に時間をかけすぎない)。使い方に個人差が出ることを前提にし、統一ルールを出すのは横展開の後半でいい。横展開した後は、最初に特定した問題が解決されたか、AIを使い始めて新たに見えてきた問題は何か、次に取り組む業務候補は何かを確認する。
よくある失敗と対策:
| 失敗 | 原因 | 対策 |
|---|---|---|
| ツールが使われなくなる | 担当者が使い方を知らない | 1〜2名に絞って深く伴走する |
| 効果が測れない | 測定指標を決めていなかった | 最初の週に「現在の時間」を記録する |
| 展開が遅い | 全員に一斉展開しようとした | 1〜2名→チーム→全体の段階的展開にする |
| ツール変更が必要になる | 最初の問題特定が曖昧だった | 「何の業務の何が問題か」まで具体化する |
任せきりにするためではない。隣で長く一緒に判断していくための土台だ。