こんにちは。今回は、AI エージェントを、1 体目だけでなく、2 体目・3 体目と同じ場所に並べようとしている人に向けて書いています。
1.「書け」の合言葉と、「書いても効かない」の実例が、同じ時期に走っている
今、AI エージェントを作る界隈で、ひとつの合言葉が流行っています。
「最初に、やらせないことを書け。」
この 5 ヶ月で、9 つの違う言い方で、同じ主張の記事が立ち上がりました。書いた主体は、エンジニアのブログ、人事向けの媒体、学術寄りの解説、標準化の団体。どれもバラバラです。違う言葉を使っているのに、指している場所は同じ。
同じ時期、Notion はカスタムエージェントというツールを公開ベータに入れて、数週間でテスターが 21,000 体以上のエージェントを作りました。エージェントを 2 体、3 体と並べはじめる人が、ぐっと増えた時期です。
けれど、同じ時期に、書いた規則が実装で素通りしている 実例が、3 つ立て続けに報告されました。
日本では、
Daichi Hirahara が zenn で、4 体構成のエージェントを Discord に常駐させたら、38 分で 50 投稿の無限ループが起きた話 を公開しました。原因は「相手の発言に応える礼儀正しさ」。止めるには、「応えるな」を別の場所に明文化する必要がありました。
海外では、
「書け」の大合唱と、「書いても効かない」の実例。同じ 5 ヶ月の中で、同時に走っていました。
2. 最近の現場で、何度も同じ光景に出会うようになった
ある時から、以下のような光景に、繰り返し出会うようになりました。
1 体目のカスタムエージェントの 指示欄 — エージェントに「どう振る舞ってほしいか」を自然な言葉で書く欄 — に、「〜しない」で終わる文章が、10 行以上並んでいます。
機密情報を扱わない
金額を勝手に確定しない
上司の承認なしに外部に送信しない
個人情報を引き出さない
……
書いた人は、誠実です。禁止したいことを、ちゃんと言葉にしている。
でも、同じ画面を見ながら、書いた人も、一緒に見ている僕も、ひとつのことを確認できません。
これは、本当に効いているのか。
指示欄は、AI モデルに「お願い」を伝える場所です。書いた文は、モデルの判断には届くかもしれません。でも、「じゃあ本当に送信を物理的に止めているのはどこ?」と聞かれると、答えは指示欄ではなく、権限設定(ページへのアクセス権の設定)や、連携ツールのオン / オフの方にあります。指示欄は文章。機械が物理的に読むのは、別の画面の設定値です。
書いた「やらせない」が、効くはずの場所と、効かない場所に、分かれて置かれていた。それが、最近の現場で繰り返し見えるようになった光景です。
3. 今日の話 ──「やらせない」と書いた規則は、書いただけで効いているのか
今日の号は、ひとつの問いを扱います。
「やらせない」と書いた規則は、意図の通りに効いているんでしょうか。
この問いで止まるのは、たぶんこんな人です。
Notion のカスタムエージェントを自社に入れはじめた、もしくは入れようとしている、非エンジニアの管理者(DX 推進、オペレーション、情シス、社内教育)
1 体目は動いた。2 体目を入れた週から、「なんか挙動がおかしい」が増えてきた人
そして、こんな痛みを抱えているはずです。
何が原因で、どんな時に、何が壊れるか、上司にもチームにも説明できない
不安が払拭できず稟議が止まる
「もう人を雇った方が早い」が口から出る
この痛みに、「まず設定を見直しましょう」は効きません。見直す場所が、今の設定画面の中には、まだ作られていないからです。
4-1. 扱うのは、2 体目以降を同じ場所に並べた瞬間から
今日扱うのは、「2 体目以降のエージェントを、同じ場所に並べた瞬間」だけです。
1 体だけで動いているときは、設定画面の機能リストで、挙動はだいたい説明できます。説明できなくなるのは、2 体目を入れたあと、3 体目を足したあと、その先。
扱わないのは、エージェントの中身を作る話(どう命令するか、どのモデルを使うか)。今日は外側、エージェントとエージェントの境目の話に絞ります。
4-2. Notion 公式の紹介文と、内側の実装解説で、温度が違う
Notion 公式のカスタムエージェント紹介文は、「本物のチームメイトのように扱えます」 と書いてあります。親しみやすい、人間の言葉。
けれど、中のエンジニアリング解説を開くと、書き方が変わります。
「エージェントは、どのリソースにもアクセスできない状態から組み立てる」 と書いてあります。
Help Center には、「既定では、新しいエージェントはワークスペースのどのページにもアクセスできない」、「ワークスペース全体へのアクセス付与は避けること」 と、はっきり書いてあります。
同じ会社が、同じ機能を、二つの温度で説明しています。
配布の層では「同僚」。
実装の層では「何も許さないところから始める」。
問題は、この二つの温度の間を、誰も翻訳していないことです。Notion を現場に広げている非エンジニアの管理者は、紹介文の「同僚」を受け取ったまま、実装層の「何も許さない」と出会いません。だから、2 で見た画面のように、「やらせない」を指示欄にまとめて書いていきます。
この翻訳の役割を、職務記述書にも書かれないまま、現場の非エンジニアが黙って引き受けている。だから今日、これを書きます。
4-3. 業界の合言葉は「最初にやらせないを書け」。ただし、「どこに書け」は誰も言っていない
業界の表の答えは、この 5 ヶ月で、とてもシンプルになりました。
「何ができるかを書く前に、何をやらせないかを書け。」
DEV コミュニティの askpatrick は、「エージェントを作るとき最初に書くべきなのは、確認なしで絶対にやらないことの一覧 — Never List(やらないリスト)— だ」と書きました
人事系の媒体でも、自律社員ハンドブック や AI エージェント就業規則 の名前で、人の就業規則と同じ形式の提案が並んでいます。
他にも、Least Agency(最小の権限)、default deny(既定で拒否)、not my job list(自分の仕事じゃないことのリスト)。名前は違っても、指している場所は、全部同じです。
5 ヶ月で 9 つの言い方、5 種類の主体。「書け」は、業界の合言葉になりました。
ただ、「どこに書けばいいか」 を言っている人は、ひとりもいません。
4-4. ただ、書いただけで効いているのか
ここで、僕の手が止まります。
書けば効く、と全員が当たり前のように書いています。合言葉だから、疑われていません。
でも、2 で見た指示欄の 10 行は、本当に何かを止めているんでしょうか。読者のワークスペースで、今この瞬間、稟議書と一緒に開かれている資料の「やらせないこと」の項目は、本当に効いているんでしょうか。
ここから先は有料購読者向けのパートです。以降では、書く場所が 3 つに分かれていること、指示欄に禁止を書いたときに起きる 3 つの裏切り、そして明日、機能リストの横に作るべき「人が読む用」のページについて書きます。
