gemini-rag

Gemini チャット履歴(Takeout JSON)をベクトル検索する RAG。トピック別クラスタで絞り込み、結果を Claude に渡してプロンプト化できる。

  • 状態:v2 稼働中(ingest→クラスタ生成→検索→抽出→Claude連携)。2026-06-04 に v2 パイプラインを 再実行(5,022チャンク/292セッション → 63クラスタ)、命名・抽出モデルを gemma3:12b から Gemma 4gemma4:e4b)へ移行。本命の gemma4:12b は公式 GGUF 配信待ち。 (branch feature/gemini-rag-v2、仕様は gemini-rag/CLAUDE.md)。
  • 技術:Python/ChromaDB/OpenAI embedding/UMAP+HDBSCAN/Ollama命名(Gemma 4)/Streamlit/ngrok公開。
  • 起動streamlit run app.pylocalhost:8501。スマホは bash start.sh(ngrok)。
  • Ollama 接続:Dev Container → ホスト側 Ollama は 172.23.32.1:11434host.docker.internal 不可)。 Ollama 更新で OLLAMA_HOST=0.0.0.0 がリセットされる点に注意。

正典:docs/gemini-rag.md。一覧 → プロジェクト一覧