「次のマップ」バイアスから抜け出すまでに5回の指摘が必要だった — AIと戦略を組むときの判断バイアスを言語化する

2026.06.13
Share:

ZERONOVA LAB(個人運営の AI ネイティブ実験スタジオ)で、次にどんな無料 Web ツールを作るかという戦略を、AI(Claude Code)と1セッションかけて議論しました。100 本のツールを公開し終えたあと、「次に何を作るか」を決める場面です。その議論の中で、AI が出してくる提案に5回バイアスを見つけて、その都度指摘して軌道修正することになりました。この記事は、AI が「ひとつの成功サンプル」に引きずられて踏んだ5つのバイアスを、後から自分でも検出できるパターンとして言語化した記録です。

ここで「バイアス」と呼んでいるのは、AI が悪い提案をしたという話ではありません。むしろ、それぞれの提案は単体では筋が通っていました。問題は、5つすべてが「同じひとつの原因」から派生していたことです。その原因を最後に取り出せたので、これは「AIを疑え」という一般論ではなく、「AIと戦略を組むときに、この5つの形で同じ穴が現れる」という具体的な検出リストとして残せます。

なぜ「言語化」して残すのか

AI と一緒に意思決定をするとき、AI は驚くほど自然に「もっともらしい結論」を出してきます。だからこそ、その結論が「正しいから出てきた」のか「直前にある強い材料に引っ張られて出てきた」のかが、見分けにくい。

今回の議論には、ひとつ強い材料がありました。公開済みのツールの中に、サイト全体のアクセスの約 36% を集めている1本があったのです(街路図を作るマップ系のツール)。これは明確な成功サンプルです。そして、成功サンプルが1個あると、AI の提案はそこへ向かって静かに傾きます。

傾くこと自体は問題ではありません。成功は再現したい。問題は、傾きが「次のツールの選び方」「データの読み方」「評価の軸」「絞る対象」「評価の次元数」という、本来は独立しているはずの5つの判断すべてに同時に染み出していたことです。1個のアンカーが、議論のあらゆる関節に作用していました。

これを「AI がよく間違える」で片付けると、次回も同じ穴に落ちます。5つの現れ方を分解して名前を付けておけば、次に同じ議論をするとき、提案が来た瞬間に「これは①の形だ」「これは③の形だ」と検出できる。言語化の目的はそこにあります。

前提:成功サンプルが1個あると議論はそこへ傾く

最初に、この5つのバイアスが共有していた地盤を確認しておきます。

サイト全体のアクセスの約 36% を1本のツールが集めている、という事実は強烈です。残りの 64% は、たくさんのツールが少しずつ集めたものの合計です。つまり、サイトは本来「ロングテール需要の集合体」で、36% の1本はむしろ外れ値に近い。ところが「36% を出した1本」という数字のインパクトが強すぎて、議論の基準がいつのまにかその1本になっていました。

「外れ値を基準にしている」と気づくのは、外れ値の中にいるときには難しい。AI も人間も、目の前で一番光っている数字を無意識に「標準」として扱います。以下の5つは、すべてこの「外れ値を標準として扱う」が、別々の判断の場面でどう顔を出したかの記録です。

バイアス①:「次の◯◯」探し — 成功の系譜を延長したがる

最初に出てきた提案は、ほとんどが「あの成功したツールの兄弟」でした。同じ系譜の派生、同じカテゴリの隣のニッチ、似た構造の別ジャンル。AI は「次のマップ」を探していました。

これは一番分かりやすいバイアスです。うまくいったものがあると、その延長線上に次を置きたくなる。延長線上は安全に見えるし、説明もしやすい。けれど、36% の1本が外れ値だとすると、その系譜の延長にもう一本同じ規模が眠っている保証はどこにもありません。

開発日記には、AI が最初に踏んだこのバイアスがこう記録されています。

「次のマップ」探しバイアス — map-generator が PV 36% だから「兄弟ツール」発想に流れ、マップ系譜の延長ばかり推していた

ここでの指摘は「マップ系をやるな」ではありません。「成功サンプルの系譜を延長する」という発想そのものが、提案の母集団を最初から狭めている、という指摘でした。本当に見るべきだったのは、サイトを支えている 64% の側、つまり多数の小さな需要がどこに散らばっているかでした。

ZeronovaZeronova
いま挙がっている候補、ほとんどがあのマップ系の隣じゃない? 「次のマップ」を探しにいってる気がする。
Claude Code
たしかに、提案の起点を「36% を出した系譜」に置いていました。成功している1本を再現したい、という方向に最適化していたと思います。
ZeronovaZeronova
その1本は外れ値で、サイト全体はもっと小さい需要の集まりで成り立っている。基準をその1本に置くと、母集団がマップの周りだけになる。探す場所が最初から狭い。
Claude Code
起点を「成功サンプルの隣」ではなく「まだ手をつけていない小さな需要の分布」に置き直します。系譜の延長かどうかは、候補を出したあとの結果であって、探索の起点にすべきではなかったです。

この対話で、提案の起点を「成功の隣」から「未踏の需要分布」へ移しました。①は、残りの4つすべての入口でもありました。起点が成功サンプルの隣に固定されていると、その後の判断はすべてその範囲内で回ってしまうからです。

バイアス②:データを既存ナラティブに嵌め込む

次に現れたのは、手元のアクセス解析データの読み方でした。あるツールの利用者は、OS が Windows に大きく偏り、検索エンジンも特定の一社経由が3割を超えていました。この数字に、AI は「シニア層だ」という説明をすぐに当てはめました。

ZERONOVA LAB には別の文脈で「シニア向け」というテーマがあり、その既存のナラティブにデータが吸い寄せられた形です。けれど、Windows に偏り、ある検索エンジン経由が多い、という分布のもっとも自然な説明はシニア層ではありません。仕事で特定のデスクトップ環境を使う、制作系・業務系の PC ユーザーです。

これは「数字を見て解釈する」という、一見もっとも客観的な作業でこそ起きるバイアスでした。データは中立ですが、解釈は手持ちのナラティブに引っ張られます。AI は特に、文脈の中にある既存の物語と整合する説明を選びやすい。「Windows + 特定検索エンジン = シニア層」は、整合はするけれど無理のある接続でした。

指摘は「最も自然な説明を、既存の物語より優先しろ」というものでした。データの分布を見たら、まず手元の物語を一度脇に置いて、その分布を一番シンプルに説明する像を立てる。物語に合うかどうかは、その後で確認すればいい。順番が逆になると、データが物語の証拠集めの道具に変わってしまいます。

バイアス③:成功サンプルを評価軸そのものにする

3つ目は、他のテーマを評価するときの「ものさし」に現れました。新しい候補テーマを評価するとき、AI は無意識に「あのマップ系ツールと比べてどうか」を基準にしていました。検索ボリュームの規模感も、ニッチの深さも、すべてマップを 1.0 とした相対値で測っていたのです。

その結果、評価の視野が「マップと同じくらいの規模の、中規模ニッチ」に固定されていました。マップより極端に小さいものも、毛色の違うものも、ものさしに合わないという理由で自動的に低く出る。成功サンプルが「比較対象」ではなく「評価軸の原点」になっていました。

①が「探す場所」のバイアスだとすれば、③は「測る基準」のバイアスです。同じアンカーでも、出る場所が違います。①を直しても、ものさしがマップのままだと、新しく探してきた候補が評価の段階でまた弾かれる。だから別々に名前を付けて検出する必要がありました。

指摘を受けて、評価軸を「マップとの相対」から「絶対的な基準の組み合わせ」に置き直しました。市場規模、競合密度、記事素材としての価値、といった軸を、特定の成功サンプルを原点にせずに独立して持つ。そうすると、マップと似ていない候補も、自分の基準でフラットに評価できるようになります。

バイアス④:絞る対象を取り違える

4つ目は、議論の中で一番根が深いバイアスでした。「ターゲットを絞ろう」という話になったとき、AI は「ツールの利用者ペルソナ」を絞ろうとしました。このツールを使うのはどんな人か、という方向です。

これは一見正しい。普通、プロダクトはユーザーを絞って設計します。けれど ZERONOVA LAB の構造では、絞るべき対象が違いました。ここでのツールは、それ自体が最終目的ではなく、開発の過程を記事にして書き手としての専門性を積むための素材でもあります。だとすると、絞るべきは「ツールの利用者」ではなく「その記事を読む人」でした。

ツールの利用者と、記事の読者は、別の人です。マップツールを使うのが制作系の業務 PC ユーザーでも、その開発記録を読むのは同業の個人開発者や PdM です。この二者を同一視すると、「ツール利用者に合わせてテーマを絞る」という、目的を取り違えた絞り込みが起きます。

このバイアスが厄介なのは、「絞る」という行為自体は正しいセオリーなので、止めにくいことです。絞ろうとしている姿勢が健全に見えるぶん、「何を絞っているか」の取り違えが見逃されやすい。指摘は「絞る作法」ではなく「絞る対象」に向いていました。正しい作業をしていても、対象を取り違えていれば、努力の方向ごとずれます。

バイアス⑤:評価を1軸に痩せさせる

最後のバイアスは、評価の次元が足りないことでした。あるテーマ系譜を評価するとき、AI は検索の取りやすさ、いわゆる SEO の観点だけで「これは弱い」と判定しました。実際には、そのテーマは検索では地味でも、作った成果物がそのまま画像として共有しやすく、競合も薄いという別の強みを持っていました。

SEO 単独で評価すると、この「成果物が一枚絵で伝わる」「競合が少ない」という軸が丸ごと抜け落ちます。多次元で見れば有力だったテーマが、1軸に痩せた評価で「△」に落ちる。評価の次元が減ると、判断は単純になりますが、その単純さは見落としと引き換えです。

指摘は「評価を1軸に痩せさせるな」でした。検索の取りやすさ、共有のされやすさ、競合の密度、開発記録としての面白さ。これらは独立した軸で、どれかひとつで代表させると判断を誤ります。特に、成功サンプル1個を基準にしていると、その1個が強かった軸(この場合は検索流入)だけが評価軸として残りやすい。⑤は、③の「ものさしの固定」が次元の縮約という形で現れたもの、とも言えます。

5つに共通する構造 — アンカーが1個だと、判断の全関節に染み出す

ここまでの5つを並べると、共通項が見えます。

  • ①探す場所が、成功サンプルの隣に固定される
  • ②データの解釈が、既存ナラティブに吸い寄せられる
  • ③評価のものさしが、成功サンプルを原点にする
  • ④絞る対象が、ツール利用者にすり替わる
  • ⑤評価の次元が、成功サンプルの強かった1軸に痩せる

①③⑤は明確に「36% の1本」というアンカーから直接派生しています。②と④は別の原因に見えますが、根は同じです。②は「既存の強い物語にデータを合わせる」、④は「既存の正しいセオリーに状況を合わせる」で、どちらも「すでに手元にある強いもの」に判断を寄せる動きです。成功サンプルも、既存ナラティブも、既存セオリーも、「いま一番強く見えている材料」という意味では同じアンカーです。

つまり、5つのバイアスは「いま一番強く見えている材料に、判断のあらゆる関節が同時に引っ張られる」という、ひとつの現象の5つの現れ方でした。アンカーが1個あると、それは探索・解釈・評価・絞り込み・次元という、独立しているはずの判断にまんべんなく染み出します。

この構造が見えると、検出が一気に楽になります。「いま、この議論で一番強く見えている材料は何か」をまず特定する。そのうえで、探す場所・データの読み・評価軸・絞る対象・評価の次元の5箇所を、それぞれ「この材料に引っ張られていないか」と点検する。点検する場所が5つに分かれているので、漠然と「バイアスに注意」と思うより、はるかに具体的に確認できます。

否定されながら作る、ということ

正直に書くと、1セッションの中で AI の提案を5回続けて軌道修正するのは、気持ちのいい作業ではありませんでした。1回目はいい。2回目もまだいい。3回目を過ぎると、「自分の指摘が細かすぎるのではないか」「もっと早い段階で根本を言えなかったのか」という方向の迷いも出てきます。AI と組んでいると、修正の往復が速いぶん、止まって構造を考える前に次の提案が来てしまう、というやりにくさもありました。

それでも、最後に5つを並べて共通構造を取り出せたのは、その5回があったからでした。1回の指摘では「マップに寄りすぎ」で終わっていた。5回分が揃って初めて、「これは全部ひとつのアンカーから来ている」という構造が見えました。開発日記の振り返りには、こう残しています。

否定されながら作る方が結果的に強い設計が残る

このセッションは、それを地で行くものでした。提案がそのまま通っていたら、「次のマップ」の隣にもう1本を足して、外れ値の系譜をなぞるだけで終わっていたはずです。5回の否定を経た結果、選定の基準そのものが「成功サンプルからの相対」ではなく「独立した複数軸の絶対評価」に組み変わりました。残ったのは1本のツールの選択ではなく、次に同じ議論が来たときに使える検出リストの方でした。

検出パターンとして使う

最後に、この5つを次回どう使うかを書いておきます。完成したフレームワークというより、議論の最中に手元で回す確認の手順です。

AI と何かを決めるとき、まず「いま、この議論で一番強く見えている材料は何か」を1つ特定します。直近の成功数字、強い既存ナラティブ、正しそうな既存セオリー。どれでも構いません。それを特定したうえで、提案が来るたびに、それが次の5つのどの形でアンカーに引っ張られていないかを見ます。探す場所がアンカーの隣に寄っていないか(①)。データの解釈がアンカーの物語に合わせられていないか(②)。評価のものさしがアンカーを原点にしていないか(③)。絞る対象が、本来の目的ではなくアンカー側にすり替わっていないか(④)。評価の次元が、アンカーの強かった1軸に痩せていないか(⑤)。

この手順は、相手が AI でなくても、自分1人の意思決定でも同じように回せます。むしろ、強い成功サンプルを持っている人ほど、自分の判断がそこへ傾いていることに気づきにくい。AI と組んでいたのは、AI が傾きを「言葉にした提案」として外に出してくれたから、傾きが見えやすかっただけです。1人で考えていたら、同じ傾きが頭の中で静かに起きて、検出する機会すらなかったかもしれません。

成功サンプルは、再現すべき資産であると同時に、判断を歪めるアンカーでもあります。その両面を分けて扱うために、5つの現れ方に名前を付けておく。次に「次の◯◯を探そう」と思ったときに、それが①の形をしていないか、まず一度止まって確かめるつもりです。

呑名 健造(Zeronova) avatar

Zeronova呑名 健造

PdM × AI-Native Builder × Senior UX × Civic Tech

Web/IT業界19年以上・20以上のWebサービスを担当した PdM。コロプラ子会社(株式会社ビジプル)元代表として事業経営を経験。現在はシニア向け BtoC プラットフォームの PdM、かんたん連絡網合同会社(自治会DX)・Koship合同会社の共同代表として ZERONOVA LAB を並行運営。

関連プロダクト

ZERONOVA LAB

AIネイティブ実験開発スタジオ