LLMのモデルの性能が上がってきて、だいたいのタスクを丸投げでなんとなくできてしまうようになった。 LLMをAIエージェントと言い換えても同じことが言える。なんでもAIに投げればできてしまうので、初手でAIに投げてしまいがちだ。

その方向性自体はあってて今後多くのタスクをAIエージェントに投げるようになるのだろうけど、LLMとしてタスクを処理するのではなく、依頼する具体的なタスクが明らかでそれが決定論的に解決可能なものであれば、そのようなツールを作って与えるべきだと思うことが何度かあった。

例えばドキュメントファイルの解析。マルチモーダルなLLMの得意とするところではあるのだけど、プレーンテキストファイルに変換したり、OCRにかけたほうがいいときもある。

コーディング規約も、AGENTS.mdとかそれに付随するRuleに書いておけばだいたい守ってくれるが、Linterにルールを書いてそのLinterを毎回実行させたほうがいいときも多い。

決定論的に片付けられることはなるべくそうして、LLMのAIが担うべき部分は何なのか、分担をうまく設計していきたい。