ソフトウェア、Agent、そしてこれからについての最近の雑感

ここ数ヶ月、何も書いていなかった。自分が何をしているのかよくわからない、特にプロジェクトをやっているわけでもない。毎日 Codex、Claude Code、OpenClaw を起動しているだけ。

OpenClaw のせいで Mac Mini（早めに買ったので値上がり前だった）、Raspberry Pi、VPS を買う羽目になった。家に遊んでいるマシンがなくなった。スマートホームをつなげたり、ロボットアームをいじったり、必要になった瞬間だけ使う小さなソフトを作ったり。ほとんどリリースしない——公開するのに作るより時間がかかるし、午後に作ったようなソフトを出すのはみんなに失礼な気がする。

それからずっと LaunchNext を改善していた。断続的に6ヶ月——ジェスチャー対応、Core Animation ProMotion 120fps、アンインストーラー連携、右クリックバッチ操作。今はかなり良いと思っている。

ソフトを作るのはやっぱり楽しい。AIがあるとさらに楽しい。去年の12月以降、複雑な機能の実装成功率が明らかに上がった。クラウドモデルは Gemini 3.1 Pro、Claude Opus 4.6、GPT 4.5 xhigh、Kimi K2.5（Cursor がこれを好むのが嬉しい）、MiniMax 2.7 がどれも良い。ローカルでは Qwen 3.5 27B をずっと動かしている——特に画像処理が必要なタスクで優秀。

SaaS とソフトウェアはビジネスとして終わったと思う。Adobe、Figma、Salesforce、IBM の株価を見ればわかる——Figma は IPO 後の高値から 80% 下落、Adobe が買収しようとした金額より時価総額が低い；Salesforce の CEO は AI エージェントがカスタマーサービスの 4000 人分を代替したと自分で言っている；Adobe の CEO は辞任したばかりで、あるアナリストは記事のタイトルをそのまま「AI SaaSpocalypse」にした。これは未来の話ではなく、もう起きている。だから自分の homemade ソフトは趣味として割り切っている。

React Native と Electron はちょっと無理（ごめん）。クロスプラットフォームはもう意味があまりないと思う——AI にコードをある言語から別の言語に翻訳させればいい、非常に複雑なソフト以外は。少し時間はかかるかもしれないけど、結果は明らかに良い。React Native がレンダリングする、native でも web でもないあの感じは使っていて分裂感がある。Cloudflare のエンジニアが AI を使って一週間で Next.js の 94% を再実装した——vinext。Vercel がそれにどれだけ費やしたか考えてみて。堀はなくなった。長期的には、ほとんどのソフトは Electron を使う必要がない——メモリを余分に食いたくなければ。個人的な意見で、会社には会社の事情があるけれど。GPUI を試してみて。作るものはメンテするかどうかに関わらず、基本的にオープンソースにする。その方が楽しい。

音声入力でのプログラミングを強くすすめる——タイピングよりずっと速い。でも話すのはまだ遅い。Neuralink があれば少し速くなるかも——帯域幅をアップグレードする必要がある。より根本的な方向性は自動化——人間をループから外すこと。人間はプロセス全体でいちばんエラーを起こしやすく効率を下げる部分。agent 自身に問題を見つけさせて、自分で修正させるのが正しい。Karpathy の autoresearch は本当に面白い——630 行の Python、agent が自分で実験を走らせて、自分でコードを改変して、overnight で 100 イテレーション、人間は program.md を書いてどの方向を探索するか伝えるだけ。AI にコードを書かせてうまくいかないなら、agent の問題じゃないかもしれない——あなたの requirement は明確だった？ agent が動いている以上、GUI はもうあまり意味がない。CLI と API が agent が実際に使うインターフェース。今詰まっているのはここ：複数の agent がきれいに協調するのはまだ難しい。今のツールに満足していない。良いものがなければ自分で作る。これは本質的にデータインフラの問題で、失敗すると本当につらい。大きなスクリーンがますます必要になっている。

OpenClaw は本当に面白い。Ghost in the Shell を思い出す。コンテキスト管理がますます重要なスキルになっている。

プログラマー、デザイナー、財務担当、アーティストはそれほど多く必要ではなくなった。組織はもっとスリムにできる。経済的な問題は頭の中で整理できない——レイオフされた人たちは消費するお金がなくなり、市場が縮小し、企業は競争力を維持するためにトークンを買い続けてさらにレイオフする、このループは見ていてつらい。大企業も同じ——効率は上がるが、レイオフはより激しく、ループはより速く回る。解決策が本当に思い浮かばない。唯一の出口かもしれないのは、agent がこれまでスキルの壁でできなかったことをできるようにしてくれること。少なくとも小さな会社にとっては良いことだ——そんなに多くの人を雇う必要がない。

AI についての自分の考えははっきりしている。話す前に考える——その思考はより高く、より抽象的なレベルで起きていて、言語は最後の出力インターフェースに過ぎない。LLM は thinking モードであれ通常の出力であれ、本質的にトークン空間で動いている——同じレベル。これは構造的な限界。JEPA は違う——表現空間で予測する、ピクセルでもトークンでもなく、「この状況で次の抽象的な状態はどうあるべきか」を予測する。強化学習 + 世界モデルが正解で、言語は UI に過ぎない。LeCun の AMI はこの方向を向いている。V-JEPA が一番近い。

この7時間のポッドキャストは今年見た中で一番楽しかった。

毎日ますます焦る。速度がまだ遅い、トークンの消費がまだ遅い、毎日過負荷状態——頭がおかしくなりそう。😂

でも振り返れば、探索できる面白いことはまだたくさんある。宇宙は広い。きっと楽しいはず。シミュレーションの中で他に何ができるというんだ。