Onyx は、組織内に散在するドキュメント・SaaS・ナレッジを 50 種以上のコネクタ(Slack, Confluence, Google Drive, Notion, GitHub, SharePoint など)で一元的にインデックス化し、LLM を介した チャット形式の検索・回答 を提供するセルフホスト型プラットフォームである。ハイブリッド検索(ベクトル+キーワード)と RAG(Retrieval-Augmented Generation)を組み合わせ、社内情報に基づく正確な回答を生成する。
バックエンドは Python/FastAPI + Celery、フロントエンドは Next.js/React で構成され、PostgreSQL・Vespa(ベクトルDB)・Redis を基盤とする。MIT ライセンスの Community Edition と、SSO/RBAC/監査ログ等を備えた Enterprise Edition の二層構造。
| 比較軸 | ChatGPT / Copilot 等 SaaS | 社内 RAG 自作 | Onyx |
|---|---|---|---|
| データの所在 | 外部クラウド送信 | 自社管理 | 自社管理(セルフホスト) |
| コネクタ数 | 限定的 | 自前実装が必要 | 50+ を標準搭載 |
| LLM 選択 | ベンダー固定 | 自由だが構築コスト大 | 任意 LLM(OpenAI, Anthropic, Ollama 等)を設定のみで切替 |
| 導入コスト | 低いが制約あり | 高い(数週〜数ヶ月) | curl 1行 or Docker Compose で即起動 |
| エンタープライズ機能 | ベンダー依存 | すべて自作 | SSO/RBAC/SCIM/監査を標準提供 |
要するに、「社内データを外に出さず、好きな LLM で、コネクタ設定だけで使い始められる」点が最大の差別化ポイントである。Deep Research(多段リサーチ)、コード実行サンドボックス、音声モード、MCP 連携といった先進機能もオープンソースで利用できる。
1. デプロイ
└─ Docker Compose で起動(Lite版: <1GB / 標準版: フル機能)
$ curl -fsSL https://onyx.app/install_onyx.sh | bash
2. 初期設定(管理画面 /admin)
├─ LLM プロバイダを登録(APIキー設定)
└─ データソースのコネクタを追加(Slack, Google Drive 等を認証・接続)
3. インデックス構築(自動)
└─ Celery ワーカーがバックグラウンドで
文書取得 → チャンク化 → 埋め込み → Vespa 登録 を実行
4. 利用開始(チャット画面 /app)
├─ 自然言語で質問 → 社内ドキュメントを根拠に回答生成
├─ カスタムエージェント作成(特定知識・ツール付き)
└─ Web 検索・コード実行・画像生成なども統合利用可能
5. 運用
├─ コネクタは定期同期(自動)
├─ RBAC でユーザー/グループ単位のアクセス制御
└─ 監査ログ・利用分析で運用状況を可視化