昨日の続きでOpenClawについて。

OpenClawについては色んな人がいろんなことを言っていて、素人は手を出すべきじゃない完成度の低いハッカーのおもちゃのようだという批評は大体合ってる。私もずっとは使わないだろう。けど一ついえるのは、これだけバズって、派生のOSSもたくさん生まれて、多くの機能を詰め込んで動くものとして実現させた功績は大きいと思う。

OpenClaw自体は数カ月後にはほとんど誰も使ってないかもしれないが、SmalltalkのようにOpenClawにあった概念は後続のAIエージェントに受け継がれていくと思う。

OpenClawがこれらの機能の世界初だったかでいうと個別の機能としてはそうではないだろう。だけどこれを1つのパッケージ化に成功して動くものにして、かつそれが世界的にバズって日本でも日経新聞に載るくらい著名になった(最初Moltbookと間違えてたようだけど)事実が大きいのかなと思う。だから私はOpenClawが特別すぐれているといいたいわけではなくて多くの人が何となく知ってる存在になったことが意義深いと思っている。

OpenAI、AIエージェント「OpenClaw」開発者を採用 - 日本経済新聞

OpenClawの特徴についていくつか例を挙げると次のような概念/機能/UXがある。

  • あらゆるチャットツールとつなげて使える
    • slack, telegram, discordあたりはもちろん、iMessage, LINEなどからも使える
    • 複数のチャットツールを使っていたとしても1つのゲートウェイという概念で管理されていて統合して使える
    • しかもそれが簡単。私はSlackしかやってないけど対話的インタフェースでセットアップが簡単だった
  • Tailscaleを使ってセキュアにリモートアクセスする仕組みがビルトインされてる
  • チャットツールの中でチャンキングしてストリーミングレスポンスする
    • 私はSlackで使っているが、長いレスポンスも1つの発言の中でこまめに修正を繰り返しながら「ストリーミングぽく」レスポンスが返ってくる
  • たくさんのAIモデルの中から好きなものを選んで使える
    • OpenAIのOAuthどうやってやるんだろうと思っていたが存在しないlocalhostのポートのURLにコールバックしてそのNot foundなURLをOpenClawのターミナルセッションにコピペするというやり方が良いなと思った(これは手法として特に新しくはないのかもしれないがとにかくUXがスムーズ)
  • Workspaceといって特定のフォルダ以下をOpenClawの作業スペースのように使わせることで、そのフォルダ以下で作業をさせるという概念としてわかりやすいし、ポータビリティ性もある
  • Workspace直下に以下のようなファイルを置ける。その分類がわかりやすくて優れてる
    • AGENTS.md これはよくあるやつ
    • BOOTSTRAP.md 起動時に1回だけ呼ばれる
    • SOUL.md エージェントのペルソナ的なもの
    • IDENTITY.md エージェントの属性的なもの
    • TOOLS.md エージェントが使う道具について
    • USER.md クライアント(ユーザー側)についての情報を書く
  • それ以外に memory/YYYY-MM-DD.md 以下に日々のメモリをテキストで保持する
  • マルチエージェント対応
  • スケジューラに対応してる。CRONみたいにスケジュール登録して呼び出せる。それをチャットから自然言語で登録もできる
    • HEAETBEATという概念があって登録しておいたタスクを定期チェックして実行させることができる。CRONを短期間に繰り返し起動するのと一緒といえば一緒だけど、これの存在によってOpenClawをアンビエントな存在ぽく使える

ブラウザツールとかスキル・プラグインがOpenClawの強力さの本丸なのかもだけど私はそこはほんの少し動かしただけだ。 

こんな感じでとにかく全部盛りみたいな感じになっていてAIエージェントのショーケースみたいな感じだし、UXが良いので起動してちょっと動かしてみるだけでだいたいの概念が「あーこういうことね」と理解できてしまう。これはセンスがいいとしかいいようがない。やはり流行ってるものはすごいなと思った。