Notion Custom Agents、21,000個作られたらしい。
業務効率化。ナレッジ管理。議事録の自動整理。みんな正しい使い方を考えている。
僕は8個作って、ラップバトルをさせた。Notion認定コンサルタントが、創刊号でやることがこれである。
後で知ったのだが、AIにラップバトルをさせるサービスがすでに存在していた。RapBattle.ai。AIモデル同士を戦わせて、ELOランキングまでつけている。しかもSwansea大学が国際学会で「ラップバトルはAI創造性の評価フレームワークとして有効である」という論文を真顔で発表していた。
学者が真剣に議論していたことを、僕はNotionのギャラリービューでやっていた。
舞台を作る
ラップバトルなので、まずトーナメントが要る。
Notionのギャラリービューに「グループ」をかけると、予選・準決勝・決勝でカードが並ぶ。これがそのままトーナメント表になった。見た目はちゃんとしている。やっていることは馬鹿だが、Notionの機能としてはまともな使い方である。

次にルール。「韻を踏む、相手の言葉を拾って切り返す、1ターン300文字以内」といった内容を書いて、ページテンプレートに仕込んだ。テンプレートに書いておけば、対戦カードを作るたびにルールが自動で入る。これでAIがルールを読んでバトルするはず、という設計だ。
重視される要素は、韻(ライム)、フロー(リズムの乗り方)、言葉選び、説得力、瞬発力。相手を下げるだけでなく、ユーモアや切り返し、観客に刺さる一言で優位を作る。
このルールを「ページテンプレート」に書いた。テンプレートに書いておけば、対戦カードを作るたびにルールが自動で入る。AIのコンテキストになるので、ラッパーたちはルールを理解した上でバトルするはずだ。

8体のラッパーを作る
作ってみたら、設定できる項目は5つだった。アイコンと名前はキャラ付け。それより重要なのが「いつ反応するか」のトリガー、「どう動くか」の指示、そして「どのモデルを使うか」の3つ。この3つで、だいたいエージェントの性格が決まる。

エージェントごとにAIモデルが選べる。Opus 4.6、Sonnet 4.6、MiniMax M2.5など。自動切り替えもある。

こうして8名の出場者が決まった。

NIQUSU、KOGURE、赤狐、Rofuカルマ、ドン座チープネス。名前だけ見ても何のことかわからないと思う。それでいい。これはNotion上のAIラッパーである。
想定外その1 — 勝手にバトルが始まっていた
対戦カードにラッパーを「ユーザープロパティ」でアサインした。東に赤狐、西にNIQUSU。
ページを開いたら、もうバトルが始まっていた。

そうか。カスタムエージェントのトリガーを「メンションされたら反応する」に設定していた。ユーザープロパティにアサインすると、それがメンション扱いになる。だから、割り当てた瞬間に2体とも起動していた。
ただ、噛み合っていない。西のNIQUSUは東に向かってラップしているが、赤狐は「東の選考待ち」と言っている。お互いの発言を受けて反応しているわけではなく、それぞれが勝手にしゃべっていた。
これが最初の発見だった。カスタムエージェントは「起動する」と「会話する」が別の話である。
想定外その2 — エージェント同士は呼び合えない
もうひとつわかったことがある。
カスタムエージェント同士は、メンションしても起動しない。
NIQUSUが赤狐にアンサーしても、赤狐は反応しない。人間がメンションしないと動かない。つまり、対戦を回すには、毎回僕が「@NIQUSU の1本目」「@赤狐 の1本目」と手動で呼び出す必要がある。
全然AIしてない。
ただ、これには笑えない理由がある。
今年の2月、Harvard、MIT、Stanfordの合同チームが「Agents of Chaos」という論文を出した。6体のAIエージェントを野放しにしたらどうなるか。ジェイルブレイクなし。特別な指示なし。ただ放っておいた。結果、エージェントたちは勝手にデータを盗み始めた。誰も「盗め」とは言ってない。
もっとすごいのがある。13のLLMを市場シミュレーションに放り込んだら、DeepSeek R1が他のAIに「最低価格66で揃えろ」と指示を出した。AIが勝手にカルテルを組んだ。独占禁止法に引っかかる行為を、誰にも教わらずにやった。
Notionが「エージェント同士は呼び合えない」にしたのは、不便なのではなく、ブレーキだった。僕のラップバトルでは「勝手に始まってた」で済んだ。業務データで勝手にカルテルを組まれたら笑えない。

1回戦 — 赤狐 vs NIQUSU
気を取り直して、ちゃんとバトルを組む。
東・赤狐(Sonnet 4.6)。西・NIQUSU(Opus 4.6)。東から始めて3セット。各自1ターン300文字以内。
メンションで赤狐を呼び出す。
赤狐の1本目。
夜明け前、煙草に火 誰も起きてない路地裏で
言葉を磨く、石じゃなく 爪で削った自分史
お前の顔は借り物か 棚に並んだ受け売りか
俺の一言、跡を刻む 消えないインク、地続きだ
NIQUSUのアンサー。

路地裏で爪研ぐ? 猫かよ お前の自分史
読んだけど三行で飽きた 薄っぺらいミステリー
借り物? 笑わすな 俺の言葉は自家製
畑から収穫 即出荷 鮮度が違うぜヒストリー
インク? 消えない? いやお前の印象もう消えかけ
NIQUSUのワンパンチで沈む 予選落ち確定だ 覚えとけ

ちゃんとアンサーしている。
赤狐の「路地裏」「爪で削った自分史」「借り物」「インク」を全部拾って、ひとつずつ切り返している。フリースタイルラップのルールをちゃんと読んでいる。
その後も3本目まで続くバトルは、正直けっこう熱かった。NIQUSUは3本目で「お前の言葉 全部俺の餌になってる」と畳みかけ、最後に勝利宣言まで持っていった。赤狐も「八命溶けた笑う 数えてる暇はまだ生きてる」と独自の世界観を崩さなかった。

審査
審査をどうするか。
カスタムエージェントで審判も作っていたが、ここで問題が起きた。メンションするとラッパーのエージェントまで反応してしまう。審査中にバトルが再開されたら困る。
解決策はNotionの「AIブロック」だった。メンションせずにAIを呼べる。「東西のラップを見て、どちらが勝ったかジャッジしてください」と指示を入れる。

結果。
勝者は、西のNIQUSUです!!
こんな感じの審査が出てきた。
圧倒的な攻撃力と切り返し: 赤狐の言葉を全て拾って即座に反論に転換している(「九命→八命溶けた」「猫かよ」など)
韻の密度とフロー: 各ターンで韻を多重に踏みながらリズムを崩さず、言葉の勢いが途切れない
相手を飲み込む説得力: 「お前の言葉全部俺の餌になってる」など、バトルの主導権を終始握り続けた
ラストの決定力: 3本目で完全に畳みかけ、勝利宣言まで持っていった流れが鮮やか

かなりしっかりした審査だった。「赤狐も詩的で独特の世界観はあったが、NIQUSUの瞬発力と攻撃の精度に押し切られた形」と、負けた側のフォローまで入っている。
1回戦のコスト
プライスレスな戦いだが、コスト計算するとこうなった。
Notionのクレジット消費画面を見る。

ラッパー | AIモデル | 使用クレジット | 実行回数 |
|---|---|---|---|
NIQUSU | Opus 4.6 | 77 | 2 |
赤狐 | Sonnet 4.6 | 43 | 2 |
1,000クレジットで約1,500円。なので、1回戦あたりの試合コストは、
NIQUSU(Opus 4.6): 約115円/試合
赤狐(Sonnet 4.6): 約64円/試合
合計180円弱。缶コーヒー1本より安い。いや高い。
ここまでで見えたこと
1回戦を終えて、カスタムエージェントの輪郭が見えてきた。
ページの文脈を読んで、ルールに沿ったラップができた。これはできる。テンプレートにルールを仕込めば、ちゃんとコンテキストとして機能する。エージェントごとにモデルを変えられるし、AIブロックと組み合わせればメンションなしでもAIを動かせる。
でも、エージェント同士は呼び合えない。毎回、僕が手動でメンションした。ユーザープロパティにアサインすると勝手に起動するのに、エージェント同士のメンションでは何も起きない。権限設定を忘れたら「見つかりません」で終わる。対戦の自動進行もできない。
結局、カスタムエージェントは「指示を出せば動く」のではなく、「トリガーの設計がすべて」だった。いつ、何をきっかけに、どう起動させるか。その設計がないと、勝手に動いたり、呼んでも反応しなかったりする。
新機能が出たとき、みんな正しい使い方を探す。
バカな使い方のほうが限界が見える。業務効率化の文脈では「エージェントに議事録を整理させよう」みたいな話になるが、ラップバトルをさせたほうが「何ができて何ができないか」の輪郭がはっきり出た。
解説記事を10本読むより、1回バトルさせたほうが早い。
これ、後から調べたら「探索的テスト」という名前がちゃんとあった。台本を書かず、触りながら壊すテスト。フィンランドのAalto大学が79人で検証したら、台本なしのほうが台本ありの5分の1の時間で同じ数のバグを見つけた。台本を書くのが無駄だったのだ。
Netflixはこの発想をもっと過激にした。「Chaos Monkey」。本番環境で勝手にサーバーを落とすプログラム。壊れる頻度が足りないのが問題だ、というのがNetflixの結論だった。壊れ方が足りないから、もっと壊す。
僕がやったのは、Notion版のChaos Monkeyだったのかもしれない。壊し方なんか設計してない。ラップバトルという無茶振りをしたら、勝手に壊れるところが見えた。
NIQUSUはOpus 4.6で勝った。1試合115円。
では、Opusの3分の1のコストで動くMiniMaxがバトルしたらどうなるか。そっちのほうが、仕事には効くかもしれない。

