---
name: llm-framework-advisor
last_verified: 2026-04-02
description: "Recommend the right LLM agent framework for a given use case. Covers framework comparison (LangChain, LangGraph, CrewAI, AutoGen, Agno, Dify, n8n, Semantic Kernel, Haystack, LlamaIndex), decision criteria (complexity, team size, vendor lock-in, self-hosting), and migration paths. Triggers on: which AI framework, agent framework comparison, LangChain vs, CrewAI vs, AutoGen vs, LangGraph vs, which LLM framework, agent orchestration, multi-agent framework, AI framework selection, or any question about choosing an AI/LLM agent framework."
---

# LLM Framework Advisor

Empfiehlt das richtige AI/LLM-Agent-Framework basierend auf Use Case, Team, Budget und Stack. Wissen destilliert aus awesome-llm-agents (55+ Frameworks mit Live-Metriken), 500-AI-Agents-Projects (160+ Use Cases), und den Praxis-Erfahrungen aus n8n und dify.

---

## Input-Parameter

| Parameter | Werte | Default | Beschreibung |
|-----------|-------|---------|-------------|
| **Use Case** | `chatbot` / `rag` / `multi-agent` / `workflow` / `code-gen` / `data-analysis` | (Pflicht) | Was soll gebaut werden? |
| **Team Size** | `solo` / `small-team` / `enterprise` | `small-team` | Wer entwickelt und wartet? |
| **Hosting** | `self-hosted` / `cloud` / `managed` | `self-hosted` | Wo soll es laufen? |
| **Budget** | `minimal` / `moderate` / `enterprise` | `moderate` | Kostenrahmen |
| **Language** | `python` / `typescript` / `both` / `csharp` | `python` | Bevorzugte Sprache |
| **LLM Provider** | `openai` / `anthropic` / `open-source` / `multi-provider` | `multi-provider` | Bevorzugter LLM-Anbieter |

---

## Framework Comparison Matrix

| Framework | Sprache | Best For | Komplexitaet | Self-Hosted | LLM Provider | Lizenz |
|-----------|---------|----------|-------------|-------------|-------------|--------|
| **LangChain** | Python, JS | Allrounder, RAG, Chains | Hoch | Ja | Multi (50+) | MIT |
| **LangGraph** | Python, JS | Stateful Agents, komplexe Flows | Hoch | Ja | Multi (via LangChain) | MIT |
| **CrewAI** | Python | Rollen-basierte Multi-Agent-Teams | Mittel | Ja | Multi | MIT |
| **AutoGen** | Python | Research, Multi-Agent-Konversation | Hoch | Ja | Multi | MIT (Microsoft) |
| **Agno** | Python | Leichtgewichtige Agents | Niedrig | Ja | Multi | MIT |
| **Dify** | Python + TS | Visual Builder, Full Platform | Niedrig (User) / Hoch (Dev) | Ja (Docker) | Multi (100+) | Modified Apache 2.0 |
| **n8n** | TypeScript | Workflow-Automation + AI | Niedrig (User) / Hoch (Dev) | Ja (Docker) | Multi (via Nodes) | Sustainable Use (fair-code) |
| **Semantic Kernel** | C#, Python, Java | Enterprise .NET Integration | Mittel | Ja | Multi | MIT (Microsoft) |
| **Haystack** | Python | Production RAG Pipelines | Mittel | Ja | Multi | Apache 2.0 |
| **LlamaIndex** | Python, TS | Data Indexing, RAG | Mittel | Ja | Multi | MIT |
| **Vercel AI SDK** | TypeScript | Next.js Streaming, Chat UI | Niedrig | Ja | Multi | Apache 2.0 |

---

## Detaillierte Bewertung

### LangChain / LangGraph

**Staerken:** Groesstes Ecosystem, meiste Integrationen, LangGraph fuer stateful Agent-Graphs
**Schwaechen:** Hohe Abstraktion, schnelle Breaking Changes, Overengineering fuer einfache Tasks
**Version Warning:** scalable-rag-pipeline nutzt LangGraph 0.0.21 -- aktuell ist 0.3.x+ mit komplett anderer API. Bei Verwendung IMMER aktuelle Version pruefen.
**Quelle:** scalable-rag-pipeline CLAUDE.md, awesome-llm-agents

### CrewAI

**Staerken:** Intuitive Rollen-Metapher (Agent = Rolle + Ziel + Backstory), einfacher als AutoGen
**Schwaechen:** Weniger flexibel als LangGraph fuer Custom-Flows, relativ jung
**Quelle:** 500-AI-Agents-Projects (40+ CrewAI Use Cases)

### AutoGen (Microsoft)

**Staerken:** Beste Wahl fuer Research-Szenarien, flexible Konversations-Patterns
**Schwaechen:** Komplexes Setup, steile Lernkurve
**Version Warning:** Viele Links in 500-AI-Agents-Projects verweisen auf AutoGen 0.2 -- aktuell ist 0.4+ mit fundamentalen API-Aenderungen
**Quelle:** 500-AI-Agents-Projects CLAUDE.md, awesome-llm-agents

### Dify

**Staerken:** Visual Builder, 100+ LLM-Provider, eingebaute RAG-Pipeline mit 30+ Vector-DB-Adaptern, MCP-Support, sofort einsetzbar
**Schwaechen:** 9-Service Docker-Setup (ressourcenintensiv), 700+ Env-Variablen, Flask statt async, Modified Apache Lizenz (kommerzielle Einschraenkungen)
**Quelle:** dify CLAUDE.md

### n8n

**Staerken:** 400+ Integrations-Nodes, LangChain-AI-Nodes, MCP-Server/Client, visueller Editor, sofort einsetzbar via Docker
**Schwaechen:** fair-code Lizenz (kommerzielle Einschraenkungen), Enterprise-Features kostenpflichtig, Node.js 22+ erforderlich
**Quelle:** n8n CLAUDE.md

### Vercel AI SDK

**Staerken:** Beste TypeScript/Next.js-Integration, Streaming-first, minimaler Overhead
**Schwaechen:** Nur fuer einfache Chat/Completion-Szenarien, kein Multi-Agent, kein RAG built-in
**Quelle:** n8n nutzt Vercel AI SDK intern fuer @n8n/agents

---

## Decision Tree

```
Brauchst du einen Visual Builder (kein/wenig Code)?
├── Ja, LLM-fokussiert -> Dify
├── Ja, Automation-fokussiert -> n8n
└── Nein, Code-first -> weiter

Primaerer Use Case?
├── RAG (Dokument-Q&A) -> LlamaIndex (einfach) oder Haystack (production)
├── Multi-Agent-Teams -> CrewAI (einfach) oder AutoGen (komplex) oder LangGraph (custom)
├── Workflow-Automation -> n8n
├── Chatbot/einfacher Agent -> Vercel AI SDK (TS) oder LangChain (Python)
├── Full Platform -> Dify
└── Code-Generierung -> LangGraph oder Custom

Sprache?
├── TypeScript -> Vercel AI SDK, LangChain.js, n8n
├── Python -> LangChain, CrewAI, AutoGen, Haystack, LlamaIndex
├── C# / .NET -> Semantic Kernel
└── Beides -> LangChain (hat Python + JS)

Self-hosted Pflicht?
├── Ja -> Alle Open-Source-Optionen, Dify (Docker), n8n (Docker)
└── Nein -> Alle Optionen offen + Managed Services
```

---

## Use Case Mapping nach Industrie

Basierend auf 500-AI-Agents-Projects (160+ Use Cases ueber 15+ Industrien):

| Industrie | Empfehlung | Alternative | Begruendung |
|-----------|------------|-------------|-------------|
| Healthcare | LangGraph | Dify | Komplexes Reasoning noetig (Diagnose-Flows), Compliance |
| Finance | LangChain + Custom | Haystack | Compliance, Custom-Tools fuer APIs, Audit-Trail |
| Legal | LlamaIndex | Dify | Dokumenten-schweres RAG, Vertragsanalyse |
| Education | CrewAI | Dify | Tutor/Student Agent-Teams, einfaches Setup |
| Customer Service | Dify | n8n | Visual Builder + RAG fuer Knowledge Base |
| E-Commerce | n8n | Dify | Multi-Channel-Automation (Email, Chat, CRM) |
| Code Generation | LangGraph | Vercel AI SDK | Tool-Chains, iteratives Code-Review |
| Data Analysis | AutoGen | CrewAI | Multi-Agent Data Exploration, Research |
| Cybersecurity | LangGraph | LangChain | Komplexe Tool-Chains, Threat Analysis |
| Real Estate | Dify | n8n | Schnelles Prototyping, Property Q&A |
| Agriculture | CrewAI | LangChain | Sensor-Daten-Analyse-Agents |
| Marketing | n8n | CrewAI | Content-Pipelines, Social-Media-Automation |

---

## Production Readiness

| Framework | Docs (1-5) | Community | Breaking Changes | Enterprise Support | Observability |
|-----------|-----------|-----------|-----------------|-------------------|---------------|
| LangChain | 4 | Sehr gross | Haeufig | LangSmith (paid) | LangSmith, LangFuse |
| LangGraph | 3 | Gross | Haeufig | LangSmith (paid) | LangSmith, LangFuse |
| CrewAI | 3 | Mittel | Mittel | CrewAI Enterprise | LangFuse |
| AutoGen | 3 | Gross | Haeufig (0.2->0.4) | Microsoft | Custom |
| Dify | 4 | Sehr gross | Selten | Dify Enterprise | LangFuse, LangSmith, OTel |
| n8n | 5 | Sehr gross | Selten | n8n Cloud/Enterprise | Sentry, OTel, Prometheus |
| Haystack | 4 | Mittel | Selten | deepset Cloud | Custom |
| LlamaIndex | 4 | Gross | Mittel | LlamaCloud | LlamaTrace |
| Vercel AI SDK | 4 | Gross | Selten | Vercel | Vercel Analytics |
| Semantic Kernel | 3 | Mittel | Mittel | Microsoft | Azure Monitor |

---

## Migration Paths

| Von | Nach | Wann | Aufwand |
|-----|------|------|---------|
| LangChain | LangGraph | Wenn stateful Agents noetig | Mittel (gleiche Ecosystem) |
| Dify Prototyp | LangGraph Production | Wenn Dify-Limits erreicht | Hoch (komplett neu) |
| n8n Automation | Custom Code | Wenn n8n-Nodes nicht reichen | Hoch (andere Architektur) |
| CrewAI | LangGraph | Wenn mehr Kontrolle ueber Flow noetig | Mittel |
| FAISS Prototyp | Qdrant Production | Wenn Persistenz/Scale noetig | Niedrig (Adapter tauschen) |
| Single Agent | Multi-Agent | Wenn Aufgabe zu komplex fuer einen Agent | Mittel-Hoch |

---

## Anti-Patterns

| Anti-Pattern | Problem | Besser |
|-------------|---------|--------|
| LangChain fuer einfache API-Calls | Massive Overengineering | Direkter API-Call oder Vercel AI SDK |
| CrewAI fuer Single-Agent-Tasks | Unnoetige Team-Abstraktion | Einfacher LangChain Agent oder Custom |
| Alte Framework-Version pinnen | API-Drift, keine Bugfixes | scalable-rag's LangGraph 0.0.21 ist warnendes Beispiel |
| Custom Orchestrierung wenn Dify/n8n reicht | Unnoetige Entwicklungszeit | Erst Low-Code testen, dann Custom |
| Framework-Wahl nach GitHub Stars | Stars != Production-Tauglichkeit | Production Readiness Matrix nutzen |
| Alles in einem Framework | Vendor Lock-in | Retrieval (LlamaIndex) + Orchestrierung (LangGraph) trennen |
| Kein Evaluation-Framework | Keine Qualitaetsmessung | Ragas oder LLM-Judge von Anfang an |

---

## Cost Considerations

| Posten | Open Source | Managed Service |
|--------|-----------|-----------------|
| Framework | Kostenlos | Kostenlos (meist MIT) |
| LLM API | $0.01-0.10/Query (Cloud) | Gleich |
| LLM Self-hosted | GPU-Kosten ($500-5000/Mo) | N/A |
| Observability | LangFuse self-hosted (kostenlos) | LangSmith ($39-400/Mo) |
| Hosting (Dify/n8n) | Server-Kosten ($20-100/Mo) | Dify Cloud ($59+/Mo), n8n Cloud ($24+/Mo) |
| Vector DB | Qdrant self-hosted (kostenlos) | Pinecone ($70+/Mo) |

**Faustregel:** LLM-API-Kosten dominieren fast immer. Framework-Kosten sind vernachlaessigbar.

---

## Output Format

Wenn du ein Framework empfiehlst, nutze dieses Format:

```
## Framework-Empfehlung

**Empfohlen:** [Framework]
**Runner-up:** [Framework]
**Begruendung:** [1-2 Saetze]
**Trade-off:** [Was du aufgibst]
**Getting Started:** [Ein Befehl oder Link]

### Warum nicht [Alternative]?
[1 Satz]
```

### Beispiele

**Chatbot fuer Kundensupport, kleines Team, self-hosted:**
```
Empfohlen: Dify
Runner-up: n8n
Begruendung: Visual Builder mit RAG-Pipeline, 100+ LLM-Provider, in 5 Minuten lauffaehig via Docker.
Trade-off: Modified Apache Lizenz, 9-Service Docker-Stack
Getting Started: cd dify/docker && docker compose up -d
Warum nicht n8n? n8n ist besser fuer Workflow-Automation, Dify ist besser fuer LLM-native Anwendungen.
```

**Multi-Agent Research-System, Python-Team:**
```
Empfohlen: LangGraph
Runner-up: CrewAI
Begruendung: Maximale Kontrolle ueber Agent-Flow via Graph-Edges, Conditional Logic, State Management.
Trade-off: Steile Lernkurve, haeufige Breaking Changes
Getting Started: pip install langgraph langchain-anthropic
Warum nicht CrewAI? CrewAI's Rollen-Metapher ist einfacher, aber LangGraph bietet mehr Kontrolle fuer komplexe Forschungs-Flows.
```

**Workflow-Automation mit AI-Features, Non-Technical Users:**
```
Empfohlen: n8n
Runner-up: Dify
Begruendung: 400+ Integrations-Nodes, AI-Nodes mit LangChain, visueller Editor, sofort nutzbar.
Trade-off: fair-code Lizenz, Enterprise-Features kostenpflichtig
Getting Started: docker run -it --rm -p 5678:5678 docker.n8n.io/n8nio/n8n
Warum nicht Dify? Dify ist LLM-fokussiert, n8n deckt den gesamten Automation-Stack ab.
```

---

## Version Warnings

Beim Verwenden von Code-Beispielen aus externen Quellen IMMER pruefen:

| Framework | Bekannte veraltete Version | Aktuelle Version | Breaking Changes |
|-----------|---------------------------|------------------|-----------------|
| LangGraph | 0.0.21 (scalable-rag-pipeline) | 0.3.x+ | Komplett neue API |
| AutoGen | 0.2.x (500-AI-Agents-Projects Links) | 0.4.x+ | Fundamental umgebaut |
| LangChain | 0.1.x (scalable-rag-pipeline) | 0.3.x+ | Import-Pfade geaendert |
| Anthropic SDK | 0.8.0 (scalable-rag-pipeline) | 1.x+ | Komplett neue API |
| FastAPI | 0.109 (scalable-rag-pipeline) | 0.115+ | Lifespan-Pattern |

**Regel:** Vor Verwendung eines Frameworks immer `pip install --upgrade [framework]` und aktuelle Docs pruefen.
