公開中 6 経路 SlimeTree-RLM 駆動 ソース MIT
SlimeTree-RLM × プラットフォーム連携
LLM 代を 60-80% 削減。
272 KB の安全装置が、答えられる質問は 即答、危ない質問は 止める。
R 判定だけを Gemini / Claude / OpenAI へ委譲、削減率は どのプロバイダでも約 73%。
Gemini = 個人含む全員 (Google AI Studio で無料発行可) / Claude · OpenAI = 法人プラン。料金は各自プロバイダ直接。
プラットフォーム連携 ハブ (18 経路) → 30 日トライアル開始 → 具体的な削減額を見る ↓ ★ 上乗せ削減 (NEW) ↓
連携プラットフォーム
SlimeTree-RLM (D/µ/R 機械分類 + audit chain) は platform 中立。各プラットフォームの API に RLM 前処理を被せるパターンを順次拡張中。
※ RLM 自体は platform 非依存。各プラットフォームの API + RLM 前処理を組合せた「公開デモ + MIT ソース + 商用パッケージ」の単位で順次公開していきます。優先プラットフォーム要望は お問い合わせ から。
具体例: 1 万件 DM / 月 の場合 ― プロバイダ別
典型的な BtoC ブランドの 1 か月分。平均 200 in / 1,000 out token、応答を投げる量は変わらず、RLM が 73% を フィルタ (D 6,200 + µ 1,100 = 7,300 件は LLM 呼出ゼロ、残り R 2,700 件だけ LLM へ)。
年間 max $13,000+ 浮く構成 (Claude Opus) も、Gemini Flash 無料 tier で 0 円運用 も同じ実装で。
+ 全 query が SHA-256 audit chain として記録、規制対応に追加コストゼロ
audit_chain_head: a3f1d2e8b4c97f5e... [✓ verified, 10,000 records]
※ サンプル比率 (D 62% / µ 11% / R 27%) は当社 4 LLM 横断ベンチ平均値、業種別調整可。料金は 2026-05 時点の公開単価ベース、各プロバイダの実数値をご確認ください。
NEXT THEME · 2026-05-30 B パターン · コスト階層 escalation ★ 全 18 demo 実装済 (示算→次は実測値)
★ マルチエージェント上乗せ削減 ― 既存 73% カットの上に更に削減
上の表は 「R 判定 2,700 件すべて同じ premium LLM (例: GPT-5 / Claude Opus) に投げる」前提。
次テーマ LLM マルチエージェント対応 ではこの 2,700 件にもう 1 段 「安い LLM 試行 → RLM が品質再判定 → 不足分だけ premium へ」 を被せます。
既存 73% カットに対して、R 部分が更に 50-70% 削減。合算で 85-92% に到達します。
[既存] 10,000 件
↓ SlimeTree-RLM (D/µ/R)
↓ D=6,200 / µ=1,100 を機械処理 (LLM call 0 件)
↓ R=2,700 ───────────────────────→ premium LLM 2,700 call
[B パターン上乗せ後] 10,000 件
↓ SlimeTree-RLM (D/µ/R)
↓ D=6,200 / µ=1,100 を機械処理 (LLM call 0 件)
↓ R=2,700
↓ ① cheap LLM (Gemini Flash 等) で全 2,700 件試行 → cheap 2,700 call
↓ ② RLM が出力品質を再判定 (R-meta verdict)
↓ ③ 「品質不足」と判定された ~15% のみ premium へ → premium 405 call
↑ 6.7× 少ない
具体例: 1 万件 DM / 月 · cheap = Gemini Flash · premium = GPT-5
baseline。
節約 $226/月 (73%)。
baseline 比 節約 $295/月 (95.3%)。
$84 → $14.6 = −$69/月。
※ escalate 率 15% は示算値 (品質再判定の保守設定)。10% なら $10.5/月 / 25% なら $23/月。
※ Gemini Flash 2,700 call ≈ $2.03 (既存表)、escalated 405 call × GPT-5 単価 ≈ $12.6 (合計 $14.6)。
premium 別 ― 同じ B パターンを 6 構成で適用
※ cheap = Gemini Flash 固定。premium 別の R-meta escalate 率は同じ 15% を適用 (品質感度が高いほど escalate 率を上げれば premium 寄せ可)。
※ どの組合せでも cheap = 同一 Gemini Flash なので、無料 tier (15 RPM) で SMB は cheap 部分 = $0 運用も可。
なぜ RLM が orchestrator として効くか
- 無改造で乗る ― 既存 D/µ/R 判定の R を「cheap 試行 → 品質再判定 → premium escalate」の 3-stage に置換するだけ。18 経路すべて同じ patch で適用可。
- 監査が破綻しない ― 既存 SHA-256 WAL chain にそのまま cheap/premium 2 段の record を追記。「どの query を cheap で済ませ、どの query を premium に escalate したか」が監査ログから完全に追跡可。
- Platform-native LLM 原則を維持 ― X 連携は Grok cheap → Grok premium、Google は Gemini Flash → Gemini Pro、Meta は cheap/premium 自由組合せ。「強制的に Gemini 入れる」とは無縁。
- fallback が自然 ― premium API が落ちても cheap の応答を返せる (品質 flag 付き)。LangGraph 等の框架だと別途配線が要る部分。
Step 1 完了: 全 18 demo (Meta 6 + X 6 + Google 6) に B mode 実装済、JS syntax verified (local + live)。Gateway 3 + bot 15 すべて「single LLM / cost-tier (B)」radio 切替可。
Step 2 完了: 専用 multi-agent demo page (6 パターン showcase) 公開、A/B/C/D/E/F 全パターン動作可。
Step 3 完了: shared module (MIT, ES module, 4 provider) 公開、AI agent (Claude Code / Codex 等) 直接 import 可。
★ Step 4 完了 (2026-06-01): 実測 dashboard で R 比率を 2 回の独立 run で実測 → 下表参照。escalation 率は Free tier の API quota 制限により完全実測不可、示算値 + 注釈で誠実維持。Billing 紐付け後の追試で確定予定 (次スプリント宿題)。
★ 示算 vs 実測 比較 (2026-06-01 確定)
measurement dashboard (`/integrations/measurement/`) で実 Gemini Flash 呼出による計測結果。R 比率は 2 回の独立 run で 28% 再現。escalation 率は Free tier 429 制限で完全実測不可、示算値 + 注釈で誠実維持。
★ 脚注: R 比率は 2 回の独立 run (2026-06-01T00:23:51Z + 00:26:55Z) で 28% 再現。escalation 率は Free tier の 429 制限により完全実測不可のため示算値を維持。本番 paid tier または WASM 版 RLM での追試で確定予定。
方法: RLM mock module (`slimetree-rlm-mock.js`、KNOWN_FACTS 6 + MUTE_TRIGGERS 4) で D/μ/R 分類 → R verdict 件のみ Gemini 2.5 Flash 呼出 → `judgeResponseQuality` で品質再判定 → 不足のみ Pro escalate (測定 run では Pro 未到達のため escalation 率は cheap response 長依存)。
6 経路 ― 誰の何が楽になるか
各経路、典型的な「困りごと」を 1 行で。詳細は各デモから。
SlimeTree-RLM Prompt Gateway
「営業時間は?」「○○のスペック教えて」を Claude に投げず即答。本当に LLM が要る議論だけが Claude を消費。
デモを試す →Threads 自動投稿 (µ-prefilter)
下書きに µ 警告 → Meta モデレーション違反でアカ凍結を回避。定型告知は確定通過。
デモを試す →Messenger 安全 Bot
「営業時間」「配送状況」「料金」は 0 token で 24 時間応答、複雑な相談は Claude へ。担当者は寝てて OK。
デモを試す →WhatsApp Business 安全 Bot
顧客最終送信から 24h 以内に即応 = template 承認待ちなく安全送信。医療/金融の audit chain 要件も同時にクリア。
デモを試す →Instagram DM 安全 Bot
投資勧誘 / アフィリ / フィッシング DM をブラウザ内で機械的に弾く。Claude 呼出ゼロ、担当者の精神も無事。
デモを試す →Graph API 汎用クライアント
Facebook / Instagram / Pages / Threads / WhatsApp 任意 endpoint を 1 UI から。応答テキストの事後 RLM 監査もここで。
デモを試す →提供形態 ― RLM ライセンス と LLM 利用は完全分離
| 形態 | 適用範囲 (RLM 機能) | RLM 料金 | LLM 料金 |
|---|---|---|---|
| ① 30 日無料トライアル (受付中) |
Gateway でメール + パスワード登録 → メール承認 → 30 日自動開始。 Meta 6 経路 + X 6 経路 すべてで RLM 機能利用可。D / µ 判定はゼロ料金で完結。 |
0 円 | 選択次第 (BYO key) Gemini = 無料 tier 可 / Claude / OpenAI / Grok = 各社課金 |
| ② SaaS 月額 (準備中) |
RLM 機能継続利用のサブスク。価格カタログ確定後にリリース予定。経路別 / Bundle 選択可。 | 確定後告知 | 同上 (BYO key) |
| ③ 受託統合 / OEM (随時) |
既存基幹 / Meta App / X App 環境への RLM 統合受託、実 WASM ライセンス供与 + エンジニアリング。LLM 連携は要件に合わせて設計。 | 問合せ | 顧客選択 (任意) |
対応 LLM プロバイダ (お客様の自由選択、4 + α)
同じ RLM 実装で、お客様が選んだ LLM 経由で R 判定処理。1 つに固定する必要なし、用途別に複数併用も可。
※ 初期構築の推奨は Gemini 2.5 Flash (無料 tier): 個人で導通確認、本番運用で別 LLM へ切替も localStorage 上の key 差替えのみで完結。RLM 設定変更不要。
技術詳細・ベンチ・特許・ソース
「中で何をやってるか」「6,870 trial で -20.4 pt 削減の実証」「Rust 単体バイナリでなぜ 272 KB か」は 資料 (Resource) 側で。
- Meta 連携ハブ (6 経路の技術詳細)
- SlimeTree-RLM 一次資料 ― 計測手続き / 4 LLM 横断 / 論文 v10 / 特許請求項 1-44
- RLM チュートリアル (入門 → 中級 → 高度)
- Gateway ソースコード (MIT)
- 製品ページ: SlimeTree-RLM (DEVICE 本籍 + AI 適用)
