GraphRAG Orchestration Service

Enterprise-grade knowledge graph service using Neo4j GraphRAG for intelligent document analysis and semantic querying.

🚀 Features

Neo4j GraphRAG Integration: Official neo4j-graphrag-python package (v1.10.1)
3 Retrieval Methods:
- Vector similarity search (chunk-based)
- Hybrid search (vector + fulltext fusion)
- Text-to-Cypher (LLM-generated graph queries)
Document Indexing: SimpleKGPipeline with automatic entity resolution
Multi-tenancy: Group-based data isolation
Azure OpenAI: GPT-4o + text-embedding-3-large (3072 dimensions)
91% Code Reduction: Replaced 1,636 lines with ~150 lines

📋 Prerequisites

Azure subscription
Neo4j Aura Pro instance
Azure OpenAI service (GPT-4o + text-embedding-3-large)
Azure CLI (az)
Azure Developer CLI (azd)
Python 3.11+

🏗️ Architecture

┌─────────────────────────────────────────┐
│   FastAPI Application (Port 8000)      │
├─────────────────────────────────────────┤
│  Neo4j GraphRAG Service                 │
│  ├─ VectorCypherRetriever              │
│  ├─ HybridCypherRetriever              │
│  ├─ Text2CypherRetriever               │
│  └─ SimpleKGPipeline (Indexing)        │
├─────────────────────────────────────────┤
│  Azure OpenAI                           │
│  ├─ LLM: gpt-4o                        │
│  └─ Embeddings: text-embedding-3-large │
├─────────────────────────────────────────┤
│  Neo4j Aura Pro (Graph Database)       │
│  └─ Group-aware multi-tenancy          │
└─────────────────────────────────────────┘

🛠️ Local Development

1. Setup Environment

# Clone repository
cd /afh/projects/graphrag-orchestration

# Create virtual environment
python -m venv venv
source venv/bin/activate  # Windows: venv\Scripts\activate

# Install dependencies
pip install -r graphrag-orchestration/requirements.txt

2. Configure Environment Variables

Create .env file:

# Azure OpenAI
AZURE_OPENAI_ENDPOINT=https://your-openai.openai.azure.com/
AZURE_OPENAI_API_KEY=your-api-key
AZURE_OPENAI_DEPLOYMENT_NAME=gpt-4o
AZURE_OPENAI_EMBEDDING_DEPLOYMENT=text-embedding-3-large
AZURE_OPENAI_EMBEDDING_DIMENSIONS=3072
AZURE_OPENAI_API_VERSION=2024-10-21

# Neo4j
NEO4J_URI=neo4j+s://your-instance.databases.neo4j.io
NEO4J_USERNAME=neo4j
NEO4J_PASSWORD=your-password
NEO4J_DATABASE=neo4j

# Multi-tenancy
ENABLE_GROUP_ISOLATION=true

3. Run Locally

cd graphrag-orchestration
python -m uvicorn app.main:app --reload --port 8000

API available at: http://localhost:8000 Docs available at: http://localhost:8000/docs

☁️ Azure Deployment

Quick Deploy

# Login to Azure
az login
azd auth login

# Deploy
azd up

Manual Deployment

# Provision infrastructure
azd provision

# Deploy application
azd deploy

📡 API Endpoints

V2 Endpoints (Neo4j GraphRAG)

Local Search (Vector Similarity)

POST /graphrag/v2/query/local
{
  "query": "Who is the CEO of Acme Corporation?",
  "top_k": 10
}

Hybrid Search (Vector + Fulltext)

POST /graphrag/v2/query/hybrid
{
  "query": "Financial performance in 2024",
  "top_k": 10
}

Structured Search (Text-to-Cypher)

POST /graphrag/v2/query/structured
{
  "query": "Show all relationships for Jane Smith"
}

Index Text

POST /graphrag/v2/index/text
{
  "text": "Your document content...",
  "document_name": "annual_report_2024.txt"
}

Required Headers

All requests must include:

X-Group-ID: your-tenant-id
Content-Type: application/json

🧪 Testing

# Run tests
pytest graphrag-orchestration/tests/

# Test specific module
pytest graphrag-orchestration/tests/services/test_neo4j_graphrag_service.py -v

# Run with coverage
pytest --cov=app graphrag-orchestration/tests/

📊 Performance

Code Reduction: 91% (1,636 → ~150 lines)
Document Compression: 84.5% (4,382 → 678 words)
Query Latency: Sub-second
Embedding Quality: 3,072 dimensions (text-embedding-3-large)

🔒 Multi-Tenancy

All data is isolated by group_id:

Neo4j nodes have group_id property
All Cypher queries filter by partition key
Cross-tenant data leaks prevented at database level

📝 Configuration

See graphrag-orchestration/app/core/config.py for all available settings.

🐛 Troubleshooting

Neo4j Connection Issues

# Test connection
python -c "from neo4j import GraphDatabase; driver = GraphDatabase.driver('neo4j+s://...', auth=('neo4j', 'password')); driver.verify_connectivity(); print('OK')"

Azure OpenAI API Issues

# Check API version
curl https://your-openai.openai.azure.com/openai/deployments?api-version=2024-10-21

Missing Dependencies

pip install --upgrade neo4j-graphrag-python==1.10.1

📚 Documentation

🤝 Contributing

This is a standalone service extracted from the Content Processing Solution Accelerator.

📄 License

MIT License - See LICENSE file for details

Name		Name	Last commit message	Last commit date
Latest commit History 627 Commits
benchmarks		benchmarks
docs		docs
examples		examples
graphrag-orchestration		graphrag-orchestration
infra		infra
scripts		scripts
tests		tests
.gitignore		.gitignore
=0.9.0		=0.9.0
ANALYSIS_AZURE_DI_UNTAPPED_GOLD_2026-01-26.md		ANALYSIS_AZURE_DI_UNTAPPED_GOLD_2026-01-26.md
ANALYSIS_ROUTE3_COVERAGE_GAP_INVESTIGATION_2026-01-25.md		ANALYSIS_ROUTE3_COVERAGE_GAP_INVESTIGATION_2026-01-25.md
ANALYSIS_ROUTE3_MODULAR_VS_LEGACY_2026-01-24.md		ANALYSIS_ROUTE3_MODULAR_VS_LEGACY_2026-01-24.md
ANALYSIS_V2_RETRIEVAL_ROOT_CAUSE_2026-01-26.md		ANALYSIS_V2_RETRIEVAL_ROOT_CAUSE_2026-01-26.md
ARCHITECTURE_DESIGN_LAZY_HIPPO_HYBRID.md		ARCHITECTURE_DESIGN_LAZY_HIPPO_HYBRID.md
BENCHMARK_EXEC_SUMMARY_2025-12-31.md		BENCHMARK_EXEC_SUMMARY_2025-12-31.md
CLOUD_DEPLOYMENT_UPDATE.md		CLOUD_DEPLOYMENT_UPDATE.md
CLOUD_TESTING_COMPLETE_2025-12-30.md		CLOUD_TESTING_COMPLETE_2025-12-30.md
CONTRIBUTING.md		CONTRIBUTING.md
CYPHER25_TESTING_GUIDE.md		CYPHER25_TESTING_GUIDE.md
DEPLOYMENT_COMPLETE_2025-12-30.md		DEPLOYMENT_COMPLETE_2025-12-30.md
DEPLOYMENT_FAST_MODE_2026-01-24.md		DEPLOYMENT_FAST_MODE_2026-01-24.md
DEPLOYMENT_TEST_SUMMARY_20260102.txt		DEPLOYMENT_TEST_SUMMARY_20260102.txt
DEPLOYMENT_VALIDATION_20260125.md		DEPLOYMENT_VALIDATION_20260125.md
DISCUSSION_SOURCES_CITATIONS_ALL_ROUTES_2025-12-31.md		DISCUSSION_SOURCES_CITATIONS_ALL_ROUTES_2025-12-31.md
HANDOVER_2026-01-03.md		HANDOVER_2026-01-03.md
HANDOVER_2026-01-04.md		HANDOVER_2026-01-04.md
HANDOVER_2026-01-05_v2.md		HANDOVER_2026-01-05_v2.md
HANDOVER_2026-01-05_v3.md		HANDOVER_2026-01-05_v3.md
HANDOVER_2026-01-06.md		HANDOVER_2026-01-06.md
HANDOVER_2026-01-06_v2.md		HANDOVER_2026-01-06_v2.md
HANDOVER_2026-01-07.md		HANDOVER_2026-01-07.md
HANDOVER_2026-01-07_v2.md		HANDOVER_2026-01-07_v2.md
HANDOVER_2026-01-08.md		HANDOVER_2026-01-08.md
HANDOVER_2026-01-09.md		HANDOVER_2026-01-09.md
HANDOVER_2026-01-12.md		HANDOVER_2026-01-12.md
HANDOVER_2026-01-13.md		HANDOVER_2026-01-13.md
HANDOVER_2026-01-14.md		HANDOVER_2026-01-14.md
HANDOVER_2026-01-16.md		HANDOVER_2026-01-16.md
HANDOVER_2026-01-18.md		HANDOVER_2026-01-18.md
HANDOVER_2026-01-19.md		HANDOVER_2026-01-19.md
HANDOVER_2026-01-20.md		HANDOVER_2026-01-20.md
HANDOVER_2026-01-21.md		HANDOVER_2026-01-21.md
HANDOVER_2026-01-22.md		HANDOVER_2026-01-22.md
HANDOVER_2026-01-24_DRIFT_WORKFLOW.md		HANDOVER_2026-01-24_DRIFT_WORKFLOW.md
HANDOVER_2026-01-27.md		HANDOVER_2026-01-27.md
HANDOVER_20260115.md		HANDOVER_20260115.md
HANDOVER_20260117_citation_section_fix.md		HANDOVER_20260117_citation_section_fix.md
HANDOVER_OPTION2_REINDEX_2026-01-11.md		HANDOVER_OPTION2_REINDEX_2026-01-11.md
HANDOVER_ROUTE3_NEGATIVE_GUARDRAILS_2026-01-10.md		HANDOVER_ROUTE3_NEGATIVE_GUARDRAILS_2026-01-10.md
HANDOVER_V2_INDEXING_ISSUE_2026-01-26.md		HANDOVER_V2_INDEXING_ISSUE_2026-01-26.md
IMPLEMENTATION_COMPLETE.md		IMPLEMENTATION_COMPLETE.md
IMPLEMENTATION_PLAN.md		IMPLEMENTATION_PLAN.md
IMPLEMENTATION_SUMMARY.md		IMPLEMENTATION_SUMMARY.md
KVP_IMPLEMENTATION_PLAN_2026-01-22.md		KVP_IMPLEMENTATION_PLAN_2026-01-22.md
LLAMAINDEX_WORKFLOW_MIGRATION_PLAN_2026-01-24.md		LLAMAINDEX_WORKFLOW_MIGRATION_PLAN_2026-01-24.md
MULTILANGUAGE_SUPPORT_PLAN_2026-01-23.md		MULTILANGUAGE_SUPPORT_PLAN_2026-01-23.md
NEO4J_2025_AURA_MIGRATION_PLAN_2026-01-10.md		NEO4J_2025_AURA_MIGRATION_PLAN_2026-01-10.md
NEO4J_CYPHER25_HANDOVER_2026-01-10.md		NEO4J_CYPHER25_HANDOVER_2026-01-10.md
PROPOSED_NEO4J_DOC_TITLE_FIX_2026-01-26.md		PROPOSED_NEO4J_DOC_TITLE_FIX_2026-01-26.md
QUESTION_BANK_HYBRID_ROUTER_2025-12-29.md		QUESTION_BANK_HYBRID_ROUTER_2025-12-29.md
QUESTION_BANK_ROUTE4_DEEP_REASONING_2026.md		QUESTION_BANK_ROUTE4_DEEP_REASONING_2026.md
QUICK_REFERENCE.md		QUICK_REFERENCE.md
README.md		README.md
REINDEX_CHECKLIST.md		REINDEX_CHECKLIST.md
REINDEX_COMPLETE_20260102.md		REINDEX_COMPLETE_20260102.md
REINDEX_EXEC_SUMMARY.md		REINDEX_EXEC_SUMMARY.md
ROUTE1_NLP_ENHANCEMENT_SUMMARY.md		ROUTE1_NLP_ENHANCEMENT_SUMMARY.md
ROUTE3_FAST_MODE_IMPLEMENTATION_2026-01-24.md		ROUTE3_FAST_MODE_IMPLEMENTATION_2026-01-24.md
ROUTE3_FAST_MODE_PLAN_2026-01-14.md		ROUTE3_FAST_MODE_PLAN_2026-01-14.md
ROUTE3_FAST_MODE_PLAN_2026-01-24.md		ROUTE3_FAST_MODE_PLAN_2026-01-24.md
ROUTE3_IMPROVEMENT_PLAN.md		ROUTE3_IMPROVEMENT_PLAN.md
ROUTE3_TEST_SUMMARY_2026-01-07.md		ROUTE3_TEST_SUMMARY_2026-01-07.md
ROUTE4_Q-D8_EVALUATION_DISCREPANCY_2026-01-25.md		ROUTE4_Q-D8_EVALUATION_DISCREPANCY_2026-01-25.md
ROUTER_EFFECTIVENESS_TEST_PLAN_2026-01-23.md		ROUTER_EFFECTIVENESS_TEST_PLAN_2026-01-23.md
ROUTER_IMPROVEMENTS_TEST_RESULTS_2026-01-24.md		ROUTER_IMPROVEMENTS_TEST_RESULTS_2026-01-24.md
ROUTE_1_VS_ROUTE_2_TEST_RESULTS_2026-01-24.md		ROUTE_1_VS_ROUTE_2_TEST_RESULTS_2026-01-24.md
SECTION_CHUNKING_VERIFICATION.md		SECTION_CHUNKING_VERIFICATION.md
SECTION_GRAPH_IMPROVEMENT_PLAN_2026-01-06.md		SECTION_GRAPH_IMPROVEMENT_PLAN_2026-01-06.md
STATUS_2026-01-01.md		STATUS_2026-01-01.md
SUMMARY_2026-01-02.md		SUMMARY_2026-01-02.md
SUMMARY_JAN22_KVP_IMPLEMENTATION.md		SUMMARY_JAN22_KVP_IMPLEMENTATION.md
TESTING_COMPLETE_2025-12-30.md		TESTING_COMPLETE_2025-12-30.md
TESTING_SUMMARY.md		TESTING_SUMMARY.md
TEST_PLAN_HIPPORAG_RETRIEVER.md		TEST_PLAN_HIPPORAG_RETRIEVER.md
TEST_RESULTS_POSITIVE_NEGATIVE_2025-12-30.md		TEST_RESULTS_POSITIVE_NEGATIVE_2025-12-30.md
TODO_20260115.md		TODO_20260115.md
VOYAGE_V2_CONTEXTUAL_CHUNKING_PLAN_2026-01-25.md		VOYAGE_V2_CONTEXTUAL_CHUNKING_PLAN_2026-01-25.md
VOYAGE_V2_IMPLEMENTATION_PLAN_2026-01-25.md		VOYAGE_V2_IMPLEMENTATION_PLAN_2026-01-25.md
analysis_q-d3_timeframe_retrieval_issue.md		analysis_q-d3_timeframe_retrieval_issue.md
analysis_q-d8_document_counting_2026-01-25.md		analysis_q-d8_document_counting_2026-01-25.md
azure.yaml		azure.yaml
bench_baseline_fixed.txt		bench_baseline_fixed.txt
bench_baseline_full.txt		bench_baseline_full.txt
bench_baseline_quick.txt		bench_baseline_quick.txt
bench_route1_after_deploy_20260104_101059.txt		bench_route1_after_deploy_20260104_101059.txt
bench_route1_after_proximity_20260104T102914Z.txt		bench_route1_after_proximity_20260104T102914Z.txt
bench_route1_document_grouping_fix_20260121_070030.txt		bench_route1_document_grouping_fix_20260121_070030.txt
bench_route1_eod_20260106.txt		bench_route1_eod_20260106.txt
bench_route1_final_20260106T143135Z.txt		bench_route1_final_20260106T143135Z.txt
bench_route1_final_20260121_122055.txt		bench_route1_final_20260121_122055.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

GraphRAG Orchestration Service

🚀 Features

📋 Prerequisites

🏗️ Architecture

🛠️ Local Development

1. Setup Environment

2. Configure Environment Variables

3. Run Locally

☁️ Azure Deployment

Quick Deploy

Manual Deployment

📡 API Endpoints

V2 Endpoints (Neo4j GraphRAG)

Required Headers

🧪 Testing

📊 Performance

🔒 Multi-Tenancy

📝 Configuration

🐛 Troubleshooting

📚 Documentation

🤝 Contributing

📄 License

About

Uh oh!

Releases

Packages

Contributors 2

Uh oh!

Languages

mirojs/graphrag-orchestration

Folders and files

Latest commit

History

Repository files navigation

GraphRAG Orchestration Service

🚀 Features

📋 Prerequisites

🏗️ Architecture

🛠️ Local Development

1. Setup Environment

2. Configure Environment Variables

3. Run Locally

☁️ Azure Deployment

Quick Deploy

Manual Deployment

📡 API Endpoints

V2 Endpoints (Neo4j GraphRAG)

Required Headers

🧪 Testing

📊 Performance

🔒 Multi-Tenancy

📝 Configuration

🐛 Troubleshooting

📚 Documentation

🤝 Contributing

📄 License

About

Resources

Contributing

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Uh oh!

Languages

Packages