こんにちは。今回は、AI エージェントを、1 体目だけでなく、2 体目・3 体目と同じ場所に並べようとしている人に向けて書いています。

1.「書け」の合言葉と、「書いても効かない」の実例が、同じ時期に走っている

今、AI エージェントを作る界隈で、ひとつの合言葉が流行っています。

「最初に、やらせないことを書け。」

この 5 ヶ月で、9 つの違う言い方で、同じ主張の記事が立ち上がりました。書いた主体は、エンジニアのブログ、人事向けの媒体、学術寄りの解説、標準化の団体。どれもバラバラです。違う言葉を使っているのに、指している場所は同じ。

同じ時期、Notion はカスタムエージェントというツールを公開ベータに入れて、数週間でテスターが 21,000 体以上のエージェントを作りました。エージェントを 2 体、3 体と並べはじめる人が、ぐっと増えた時期です。

けれど、同じ時期に、書いた規則が実装で素通りしている 実例が、3 つ立て続けに報告されました。

日本では、

Daichi Hirahara が zenn で、4 体構成のエージェントを Discord に常駐させたら、38 分で 50 投稿の無限ループが起きた話を公開しました。原因は「相手の発言に応える礼儀正しさ」。止めるには、「応えるな」を別の場所に明文化する必要がありました。

海外では、

「書け」の大合唱と、「書いても効かない」の実例。同じ 5 ヶ月の中で、同時に走っていました。

2. 最近の現場で、何度も同じ光景に出会うようになった

ある時から、以下のような光景に、繰り返し出会うようになりました。

1 体目のカスタムエージェントの 指示欄 — エージェントに「どう振る舞ってほしいか」を自然な言葉で書く欄 — に、「〜しない」で終わる文章が、10 行以上並んでいます。

❝

機密情報を扱わない
金額を勝手に確定しない
上司の承認なしに外部に送信しない
個人情報を引き出さない
……

書いた人は、誠実です。禁止したいことを、ちゃんと言葉にしている。

でも、同じ画面を見ながら、書いた人も、一緒に見ている僕も、ひとつのことを確認できません。

これは、本当に効いているのか。

指示欄は、AI モデルに「お願い」を伝える場所です。書いた文は、モデルの判断には届くかもしれません。でも、「じゃあ本当に送信を物理的に止めているのはどこ？」と聞かれると、答えは指示欄ではなく、権限設定（ページへのアクセス権の設定）や、連携ツールのオン / オフの方にあります。指示欄は文章。機械が物理的に読むのは、別の画面の設定値です。

書いた「やらせない」が、効くはずの場所と、効かない場所に、分かれて置かれていた。それが、最近の現場で繰り返し見えるようになった光景です。

3. 今日の話 ──「やらせない」と書いた規則は、書いただけで効いているのか

今日の号は、ひとつの問いを扱います。

「やらせない」と書いた規則は、意図の通りに効いているんでしょうか。

この問いで止まるのは、たぶんこんな人です。

Notion のカスタムエージェントを自社に入れはじめた、もしくは入れようとしている、非エンジニアの管理者（DX 推進、オペレーション、情シス、社内教育）
1 体目は動いた。2 体目を入れた週から、「なんか挙動がおかしい」が増えてきた人

そして、こんな痛みを抱えているはずです。

何が原因で、どんな時に、何が壊れるか、上司にもチームにも説明できない
不安が払拭できず稟議が止まる
「もう人を雇った方が早い」が口から出る

この痛みに、「まず設定を見直しましょう」は効きません。見直す場所が、今の設定画面の中には、まだ作られていないからです。

4-1. 扱うのは、2 体目以降を同じ場所に並べた瞬間から

今日扱うのは、「2 体目以降のエージェントを、同じ場所に並べた瞬間」だけです。

1 体だけで動いているときは、設定画面の機能リストで、挙動はだいたい説明できます。説明できなくなるのは、2 体目を入れたあと、3 体目を足したあと、その先。

扱わないのは、エージェントの中身を作る話（どう命令するか、どのモデルを使うか）。今日は外側、エージェントとエージェントの境目の話に絞ります。

4-2. Notion 公式の紹介文と、内側の実装解説で、温度が違う

Notion 公式のカスタムエージェント紹介文は、「本物のチームメイトのように扱えます」と書いてあります。親しみやすい、人間の言葉。

けれど、中のエンジニアリング解説を開くと、書き方が変わります。

「エージェントは、どのリソースにもアクセスできない状態から組み立てる」と書いてあります。
Help Center には、「既定では、新しいエージェントはワークスペースのどのページにもアクセスできない」、「ワークスペース全体へのアクセス付与は避けること」と、はっきり書いてあります。

同じ会社が、同じ機能を、二つの温度で説明しています。

配布の層では「同僚」。
実装の層では「何も許さないところから始める」。

問題は、この二つの温度の間を、誰も翻訳していないことです。Notion を現場に広げている非エンジニアの管理者は、紹介文の「同僚」を受け取ったまま、実装層の「何も許さない」と出会いません。だから、2 で見た画面のように、「やらせない」を指示欄にまとめて書いていきます。

この翻訳の役割を、職務記述書にも書かれないまま、現場の非エンジニアが黙って引き受けている。だから今日、これを書きます。

4-3. 業界の合言葉は「最初にやらせないを書け」。ただし、「どこに書け」は誰も言っていない

業界の表の答えは、この 5 ヶ月で、とてもシンプルになりました。

「何ができるかを書く前に、何をやらせないかを書け。」

DEV コミュニティの askpatrick は、「エージェントを作るとき最初に書くべきなのは、確認なしで絶対にやらないことの一覧 — Never List（やらないリスト）— だ」と書きました
evoked.dev は、「一番難しい仕様は、エージェントが何をできるかではなく、何を拒むべきかだ」と書きました。
人事系の媒体でも、自律社員ハンドブックや AI エージェント就業規則の名前で、人の就業規則と同じ形式の提案が並んでいます。

他にも、Least Agency（最小の権限）、default deny（既定で拒否）、not my job list（自分の仕事じゃないことのリスト）。名前は違っても、指している場所は、全部同じです。

5 ヶ月で 9 つの言い方、5 種類の主体。「書け」は、業界の合言葉になりました。

ただ、「どこに書けばいいか」 を言っている人は、ひとりもいません。

4-4. ただ、書いただけで効いているのか

ここで、僕の手が止まります。

書けば効く、と全員が当たり前のように書いています。合言葉だから、疑われていません。

でも、2 で見た指示欄の 10 行は、本当に何かを止めているんでしょうか。読者のワークスペースで、今この瞬間、稟議書と一緒に開かれている資料の「やらせないこと」の項目は、本当に効いているんでしょうか。

ここから先は有料購読者向けのパートです。以降では、書く場所が 3 つに分かれていること、指示欄に禁止を書いたときに起きる 3 つの裏切り、そして明日、機能リストの横に作るべき「人が読む用」のページについて書きます。

Paid Subscribe

アップグレードして続きを読む。

Upgrade

#1 | 効かない規則