CHAIR: A Library for Collaborative Human-AI Inductive Research

CHAIR is a comprehensive library for conducting inductive qualitative data analysis using Large Language Models (LLMs) and human-AI collaboration.

Overview

CHAIR provides a complete pipeline for inductive qualitative data analysis, featuring:

Flexible Data Input: Support for text files, Word documents, and structured data formats
AI-Powered Coding: Support for multiple LLM providers (OpenAI, Google, Anthropic, Groq, Ollama, etc.)
Multiple Coding Strategies: Item-level, chunk-level, and specialized analysis approaches
Human-AI Collaboration: Interactive and automatic modes for coding and consolidation
Advanced Consolidation: Smart merging and refinement of coding results
Evaluation Framework: Network-based evaluation and visualization tools
Multi-step Analysis Pipeline: Complete Load → Code → Consolidate → Evaluate workflow

Analysis Pipeline

1. Load Step

Load your qualitative data from various sources:

Text files
Word documents (with qualitative codes as comments)
Excel Spreadsheets (with qualitative codes)

2. Code Step

Apply Generative AI coding strategies:

Item-Level Analysis: Individual data item analysis
Chunk-Level Analysis: Process larger text segments
BERTopic Integration: Automatic topic modeling

In parallel or alternatively, load human coding results.

3. Consolidate Step

Merge and refine coding results:

Simple Merger: Basic consolidation
Refine Merger: Similarity-based merging
Definition Generator: Auto-generate code descriptions

4. Evaluate Step

Assess and visualize results:

Network Analysis: Graph-based coding relationships
Coverage Analysis: Completeness assessment
Interactive Visualization: Web-based exploration

Quick Start

📖 See TUTORIAL.md for complete installation and usage instructions

Prerequisites

Node.js (v20 or later)
Python (v3.12 or later)

Installation

git clone https://github.com/CIVITAS-John/CHAIR.git
cd CHAIR

# Windows
scripts\setup.bat

# Unix/Mac
./scripts/setup.sh

The setup script will:

Check Node.js installation (v20+)
Create .env file with API keys
Install Node.js dependencies
Build the project
Setup Python virtual environment
Install Python dependencies

Running Example Analysis

After installation, you can run the provided examples to see the framework in action:

# Build the project with examples
npm run build:examples

# Run automatic analysis (processes txt-data)
node out/examples/example-automatic.js

# Run interactive analysis (processes docx-data with user input)
node out/examples/example-interactive.js

Development

Building

npm run build             # Build main project
npm run build:examples    # Build with examples
npm run build:workspaces  # Build with workspaces

Code Quality

npm run lint         # Run ESLint and Prettier
npm run format       # Auto-fix formatting issues

Project Structure

src/
├── coding/           # Analysis strategies and implementations
├── consolidating/    # Code merging and consolidation logic
├── evaluating/       # Evaluation metrics and visualization
├── loading/         # Data loading implementations
├── steps/           # Pipeline step definitions
├── utils/           # Utilities for LLMs, embeddings, file
examples/            # Example configurations and data

Contributing

Fork the repository
Create a feature branch
Make your changes with appropriate tests
Submit a pull request

License

CHAIR is licensed under the Creative Commons Attribution-NonCommercial 4.0 International License. See LICENSE.md for details.

Citation

If you use this software in your research, please cite:

@software{chen2025chair,
  title={CHAIR: A Library for Collaborative Human-AI Inductive Qualitative Research},
  author={Chen, John and Zhang, Yanjia and Cheng, Sihan},
  year={2025},
  institution={Northwestern University},
  url={https://github.com/CIVITAS-John/CHAIR}
}

Support

📖 See TUTORIAL.md for detailed setup and usage instructions
🐛 Report issues on GitHub Issues
💬 Join discussions in GitHub Discussions

Contributors

John Chen, Northwestern University - [email protected]
Yanjia Zhang, Northwestern University - [email protected]
Sihan Cheng, Northwestern University - [email protected]

Name		Name	Last commit message	Last commit date
Latest commit History 474 Commits
.claude		.claude
.vscode		.vscode
docs		docs
examples		examples
scripts		scripts
src		src
.env.example		.env.example
.gitignore		.gitignore
.prettierignore		.prettierignore
.prettierrc		.prettierrc
LICENSE.md		LICENSE.md
README.md		README.md
eslint.config.js		eslint.config.js
mypy.ini		mypy.ini
package.json		package.json
pyproject.toml		pyproject.toml
requirements.bertopic.txt		requirements.bertopic.txt
requirements.hdbscan.txt		requirements.hdbscan.txt
requirements.txt		requirements.txt
setup.bat		setup.bat
setup.sh		setup.sh
tsconfig.json		tsconfig.json
typedoc.json		typedoc.json
uv.lock		uv.lock

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

CHAIR: A Library for Collaborative Human-AI Inductive Research

Overview

Analysis Pipeline

1. Load Step

2. Code Step

3. Consolidate Step

4. Evaluate Step

Quick Start

Prerequisites

Installation

Running Example Analysis

Development

Building

Code Quality

Project Structure

Contributing

License

Citation

Support

Contributors

About

Uh oh!

Releases

Packages

Contributors 2

Uh oh!

Languages

License

CIVITAS-John/CHAIR

Folders and files

Latest commit

History

Repository files navigation

CHAIR: A Library for Collaborative Human-AI Inductive Research

Overview

Analysis Pipeline

1. Load Step

2. Code Step

3. Consolidate Step

4. Evaluate Step

Quick Start

Prerequisites

Installation

Running Example Analysis

Development

Building

Code Quality

Project Structure

Contributing

License

Citation

Support

Contributors

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Uh oh!

Languages

Packages