研究 · エビデンス層 · 東京

継続性は痕跡を残す。

私たちは、運用同一性がセッション、モデル遷移、障害を越えてどのように維持されるかを 研究し、それを測定する。基盤は変数であり、継続性は測定対象である。

基盤は変数である。

これまで知能は、シリコン、GPU、推論エンドポイントなど、特定の基盤ごとに 測定されてきた。次の世代では、それだけでは不十分になる。KodaSōkenは、継続性を マーケティング上の主張ではなく、第一級の工学的性質として研究する。

継続性テレメトリ —— デーモンサイクル、メモリバージョン、復旧

01 — エビデンス層

主張ではなく、測定可能な痕跡。

デーモンサイクル、バージョン管理されたメモリ、モデル遷移、復旧イベント —— これらはすべて、稼働中のランタイムに痕跡を残す。私たちは、システム自身が 書き込むテレメトリを読み、そこから継続性を測定する。

公開中の論文を読む

02 — 継続性ベンチマーク

4回のモデル遷移。運用同一性の損失ゼロ。

継続性は、簡単な条件ではなく、厳しい条件で測定されなければならない —— ライブの コンテキストウィンドウを消去し、永続化されたメモリだけから運用同一性を復元する。 エージェントは、温かいセッションではなく、以前に記録された状態から応答する。 私たちは、難易度が段階的に上がる4つのレベルで評価する。

C1 — セッション境界の想起

運用状態が、単一のセッション境界を越えて維持される。これは、すべての アシスタントが満たすべき最低ラインである。

C2 — セッション横断の継続性

運用同一性、ポリシー、メモリが、数週間にわたる実運用と複数セッションを越えて 維持される —— 一つの長いコンテキストではなく、置かれては再び拾い上げられる糸である。

C3 — モデル移行耐性

モデルおよびプロバイダが変更されても、運用同一性が維持される —— Opus、DeepSeek、Qwen、Codexへの移行を4回完了し、損失は確認されていない。

C4 — コールドリスタートからの自己再構成

消去後、新しい基盤上で、永続化されたメモリだけから運用同一性を再構成する。 これは現在も研究を進めているフロンティアである。

稼働中のメッシュで測定。4/4のモデル遷移を維持 · 139以上のバージョン管理済みメモリ状態、損失なし · 83:1の自律対認知比は継続運用中に 観測された。C1〜C3は実証済み;C4は現在進行中の研究である。各結果は、メモリバージョンと エビデンス区間に紐づけられており、監査可能である。これらは稼働中のシステム内部で 観測された結果であり、外部再現は今後の課題である。主張の範囲は下記に明示する。

03 — 私たちが研究するもの

4つのテーマ。一つの継続性スタック。

永続メモリアーキテクチャ

作業メモリ、日次メモリ、長期意味メモリ、ガバナンス、継続状態からなる多層メモリ。バージョン管理されたファイルにより、セッションと移行を越えて運用コンテキストを保持する。

基盤透過型ランタイム

KoLoは、モデルをエージェントから抽象化する。メモリ、ポリシー、テレメトリはモデルの重みの外側に存在し、状態はプロバイダやデプロイ環境の変更後も維持される。

エージェントメッシュ・トポロジー

型付きA2Aメッセージング、決定論的な順序制御、人間のガバナンス下での監督。5エージェントのメッシュを、研究条件下で継続的に運用する。

自律エージェント・ランタイム

Daemon V2:監視、スケジューリング、サーキットブレーカー、対話、重複排除。13/13のモジュールテストに合格。エージェントはスケジュールされたサイクルを実行し、休止ウィンドウを持つ。

04 — 未解決の問い

私たちが研究している問い。

重みの外側にある継続性

エージェントの継続性は、モデルの重みの外側、すなわちメモリ、ポリシー、継続状態にどこまで保持できるのか?

最小限の運用同一性アーキテクチャ

遷移、再起動、基盤変更を越えて運用同一性を維持するために、最低限どのメモリ構造が必要なのか?

自律サイクルと認知サイクル

背景で実行される自律サイクルを、認知推論に対してどのようにベンチマークすべきか? 持続可能な比率はどこにあるのか?

異種混在メッシュの安定性

レイテンシ、順序制御、障害特性が異なるモデル基盤を跨いでも、エージェントメッシュは安定性を保てるのか?

バイオコンピューティング以前の抽象化

生物計算との統合が可能になる前に、どのランタイムプリミティブが存在していなければならないのか?

監督と監査可能性

長期運用されるエージェントに対して、人間の監督、監査ログ、承認ゲートをどのように設計すべきか?

05 — ワーキングペーパー

今はドラフト。再現可能になればプレプリント。

手法、ログ、再現性ノートが整い次第、公開する。テレメトリサンプルは、NDA締結済みの適格パートナーに共有可能。

KoLo:永続エージェントのための基盤ミドルウェア

準備中。継続性優先のランタイム、基盤抽象化、そして4層エージェントメッシュ。

非生物エージェントにおけるクラスIII情報処理

探索的研究。測定可能なエージェンシー前駆体、継続性ベンチマーク手法、83:1の自律対認知比。

公開中の論文を読む ↗

エージェント継続性のための永続メモリアーキテクチャ

準備中。STM、日次メモリ、長期メモリ、ガバナンス、継続状態。可観測性、バージョン管理、復旧。

マルチモデルシステムのためのエージェントメッシュ・トポロジー

準備中。A2Aメッシュ設計、サブエージェント生成、型安全な順序付きメッセージング、展開からの教訓。

06 — 主要文献

私たちが依拠する文献。

Kagan et al. (2026) — エージェンシー階層

測定可能で基盤非依存のエージェンシー前駆体フレームワーク。arXiv:2601.03498 —— 私たちの自律対認知ベンチマークの基礎。

arXivで読む ↗

Kagan et al. (2026) — 閉ループAPI

生物学的ニューラルネットワークとのリアルタイム閉ループ対話。arXiv:2602.11632 —— 私たちの基盤ドライバ研究が目指すインタフェースの形。

arXivで読む ↗

Wang et al. (2025) — NeuroAI / SBI レビュー

ハードウェア/ソフトウェア/ウェットウェアのスタックを地図化。arXiv:2509.23896 —— 私たちのランタイム層が占めようと備える三角形。

arXivで読む ↗

Kagan et al. (2022) — インビトロ学習

シミュレートされたゲーム世界に身体化されたニューロンが学習する。Neuron 110(23), 3952–3969 —— プログラム可能な生物計算に関する基礎研究。

Neuronで読む ↗

07 — 主張の範囲

何が観測され、何が今後の課題か。

稼働中のランタイム内で観測済み:セッションを越えた永続メモリ · モデルおよびプロバイダ遷移 · 83:1の自律対認知比 · 13/13のデーモンモジュールテスト · 統制条件下の5エージェントメッシュ · 2026年4月17日のセキュリティ・ストレス・テレメトリ。

今後の課題:生物計算との統合 · ニューロモーフィック・アダプタ · 外部再現性 · パートナー研究室での検証 · 正式なベンチマーク公表。


大学、研究室、計算基盤ベンダーの皆様へ。

共同ベンチマーク、共著論文、基盤アダプタ実験について、ぜひご相談ください。

研究協業を相談する →