AmtsScore Methodik v0
Stand: 2026-05-15 (v0.1 draft) Status: Pre-launch â Diskussion + Feedback erbeten vor v1 (Q1/2026-Release).
Zweck dieses Dokuments
Transparente, nachprĂŒfbare Methodik der AmtsScore-Messung. Wer kritisiert, kritisiert konkrete Kriterien und Gewichte â nicht eine Meinung. Diese Offenheit ist die zentrale Verteidigung des Indexes (vgl. Stiftung Warentest, Schufa, Google Lighthouse).
Grundprinzipien
- Nur öffentlich messbare Daten. Keine Umfragen, keine SelbstauskĂŒnfte, keine vertraulichen Quellen. Alle Daten lassen sich von jedem Dritten reproduzieren.
- BĂŒrger-Perspektive. Was zĂ€hlt, ist was eine BĂŒrgerin auf der Website tatsĂ€chlich erreichen kann â nicht was die IT-Abteilung intern verwendet.
- Multi-dimensional. Der AmtsScore ist eine gewichtete Summe von 10 Sub-Scores. Eine Stadt mit perfektem Score in 9 Dimensionen und 0 in einer hat keinen perfekten AmtsScore.
- Reproduzierbar. Methodik + Daten + Code (spĂ€ter) sind öffentlich. Jeder Score lĂ€sst sich rĂŒckgĂ€ngig nachvollziehen.
- Kontinuierlich. Quartalsweise Messung. VerÀnderung ist sichtbar.
Messgegenstand
Phase v0 (jetzt): 20 deutsche GroĂstĂ€dte (>200.000 Einwohner). Eine Domain pro Stadt: die offizielle stadt-X.de oder vergleichbare Hauptdomain der Stadtverwaltung.
Phase v1 (Q2/2026): 50 StĂ€dte. Phase v2 (Q4/2026): 100 StĂ€dte. Phase v3 (Q1/2027): 401 BĂŒrgerĂ€mter Deutschland-weit.
Die 12 Dimensionen
Grundlagen: Was BĂŒrger:innen heute brauchen (D1âD10)
| # | Dimension | Was wird gemessen | Werkzeug | Max-Score |
|---|---|---|---|---|
| 1 | Online-Termin-Buchung | Existiert eine Online-Buchung? Welcher Anteil der Dienstleistungen ist online buchbar? | Pattern-Detection (TerminVer / SAGA / Maerker etc.) + Sitemap-Scan | 0â10 |
| 2 | Anzahl Online-Dienstleistungen | Wie viele Verwaltungsleistungen sind komplett online erledigbar (OZG-Kategorie 4)? | Sitemap + Page-Pattern (FIM/LeiKa) | 0â10 |
| 3 | Mobile / Lighthouse Performance | Page-Speed + Mobile-Optimierung auf der Startseite + drei Dienstleistungs-Seiten | Lighthouse (Performance-Score) | 0â10 |
| 4 | Barrierefreiheit (BITV/WCAG) | Automatische PrĂŒfung gegen BITV 2.0 / WCAG 2.1 AA | axe-core | 0â10 |
| 5 | Open-Data-Portal | Eigenes Open-Data-Portal verfĂŒgbar? Anzahl Datasets? AktualitĂ€t? | URL-Probe (/opendata, opendata.{stadt}.de) + GovData-Lookup |
0â10 |
| 6 | Strukturierte Daten | Schema.org-Markup auf Dienstleistungs-Seiten (GovernmentService, GovernmentOrganization) | JSON-LD-Parse | 0â10 |
| 7 | Mehrsprachigkeit | VerfĂŒgbare Sprachen? Englisch? TĂŒrkisch? Arabisch? Ukrainisch? | lang-Attribute + Sprachwechsel-Detection |
0â10 |
| 8 | Datenschutz + Sicherheit | HTTPS ĂŒberall? Security-Headers? Cookie-Banner DSGVO-konform? Tracker-Anzahl? | HTTP-Header-Scan + Cookie-Audit + Initial-Network-Capture | 0â10 |
| 9 | Auffindbarkeit / SEO | Wird die Stadt-Website bei typischen BĂŒrger-Anfragen gefunden? Strukturierte Sitemap? Robots? | Sitemap-ValiditĂ€t + Bing/Google-SERP-Position fĂŒr Top-10-Anliegen | 0â10 |
| 10 | AktualitĂ€t | Wann wurden Inhalte zuletzt aktualisiert? Tote Links? | Last-Modified-Header + Linkchecker | 0â10 |
Zukunft: Was BĂŒrger:innen 2026+ brauchen (D11âD12)
Verwaltung-Websites bedienen nicht mehr nur Menschen. Sie bedienen auch KI-Assistenten, Apps, Aggregatoren, Software-Agenten. Eine Stadt-Website, die fĂŒr ChatGPT, Perplexity oder Claude unsichtbar ist, wird ihre BĂŒrger:innen ab 2027 nicht mehr erreichen. Diese zwei Dimensionen messen die Maschinen-Lesbarkeit + KI-Bereitschaft.
| # | Dimension | Was wird gemessen | Werkzeug | Max-Score |
|---|---|---|---|---|
| 11 | Maschinen-Lesbarkeit + KI-Bereitschaft | llms.txt vorhanden? Robots.txt erlaubt AI-Bots (GPTBot, ChatGPT-User, PerplexityBot, ClaudeBot, Google-Extended)? Non-JS-Rendering (Bot-Readable HTML)? Stabile Permalinks? |
HTTP-Probe + DOM-Test mit deaktiviertem JS | 0â10 |
| 12 | Maschinen-Schnittstellen (API + MCP) | Ăffentliche API fĂŒr Service-Abfragen (REST/GraphQL)? OpenAPI/Swagger-Dokumentation? MCP-Server-Endpunkt? | URL-Probe fĂŒr /api, /.well-known/mcp, OpenAPI-Discovery |
0â10 |
Heute werden fast alle StĂ€dte D11 + D12 nahe Null haben. Das ist Absicht. AmtsScore macht sichtbar, was als nĂ€chstes kommt â bevor es zu spĂ€t ist.
Siehe Glossar: Maschinen-Lesbarkeit + KI-Bereitschaft.
Gewichtung v0
Alle Dimensionen mit Gleichgewicht (12 Ă 1/12 â 8,33%) fĂŒr v0. Vorteil: keine implizite Wertung, einfach erklĂ€rbar.
Geplante Anpassung in v1: Gewichtung nach BĂŒrger-Relevanz. Die Grundlagen-Dimensionen (D1, D2, D4, D8) bekommen höhere Gewichte, weil sie BĂŒrger:innen unmittelbar betreffen. Die Zukunfts-Dimensionen (D11, D12) behalten in v1 noch volles Gewicht â wir wollen den Anpassungsdruck nicht senken. Anpassung wird transparent dokumentiert; v0-Gleichgewicht und v1-relevanzgewichtet werden parallel publiziert, sodass keine Stadt "ĂŒber Nacht abstĂŒrzt" durch Methodik-Ănderung.
Composite-Berechnung
AmtsScore = sum(w_i * sub_score_i) for i in 1..12
Mit w_i = 1/12 â 0.0833 in v0 (Gleichgewicht).
Ergebnis: 0.0 (komplett analog) bis 10.0 (Spitzenklasse).
Klassen-Einteilung (fĂŒr Award-Phase ab Year 2)
| AmtsScore-Bereich | Klasse | Zertifikat-Anrecht |
|---|---|---|
| 9.0â10.0 | AmtsScore Gold | Ja |
| 7.5â8.9 | AmtsScore Silber | Ja |
| 6.0â7.4 | AmtsScore Bronze | Ja |
| 4.0â5.9 | Standard | Nein |
| 0â3.9 | Nachholbedarf | Nein |
Was bewusst NICHT gemessen wird (v0)
- Interne IT-ModernitĂ€t (z.B. Cloud-Migration, eAkte) â nicht von auĂen messbar
- Mitarbeiter-Zufriedenheit â gehört zu Umfragen, nicht zu Web-Messung
- Politische Ausrichtung â irrelevant fĂŒr BĂŒrger-Erfahrung
- Telefon-Service / Vor-Ort-Service â anderes Medium, andere Messung
- OZG-Compliance-Status laut Selbstauskunft â SelbstauskĂŒnfte sind keine Messung
Diese Punkte können in spÀteren Phasen (v3+) als separate Indizes folgen, aber AmtsScore v0 ist bewusst rein Web-Performance.
Fehlerquellen + Grenzen
Klar zu kommunizieren in jeder Veröffentlichung:
- Stichtag der Messung pro Stadt â manche Verbesserung kann zwischen Messung und Publikation entstehen
- Lighthouse-Score variabel ±5% â wir messen 3Ă und nehmen den Median
- axe-core erkennt ~30% aller BITV/WCAG-VerstöĂe â der Score ist eine Untergrenze, kein Vollaudit
- Cookie-Banner-Bewertung ist regelbasiert â komplexe DSGVO-Klauseln werden simplifiziert
- Schema.org-Markup ist freiwillig â fehlendes Markup â schlechter Service, aber schlechte Auffindbarkeit fĂŒr KI-Bots
- 20 StĂ€dte = nicht reprĂ€sentativ fĂŒr DE-weite VerwaltungsqualitĂ€t â in v0 explizit nur GroĂstadt-Ranking
Validierung + Peer-Review (vor v1-Release)
Geplante Schritte vor erstem öffentlichen v1-Release:
- Hochschul-Reviewer: Hammerschmid (Hertie School) + ein:e BITV-Expert:in der HWR Berlin
- Praxis-Reviewer: 2â3 Stadt-CIOs (Berlin / Hamburg / Köln) prĂŒfen Methodik anonymisiert
- Ăffentliche Kommentierungsphase: Methodik-Paper auf amtsscore.de + GitHub, 4 Wochen Kommentare via Pull Request
- Datenschutz-Audit: Kurze PrĂŒfung durch datenschutz-cert ob Messmethodik selbst DSGVO-konform (kein Tracking von BĂŒrger:innen wĂ€hrend des Scans)
Erst nach 1â4 wird der erste öffentliche AmtsScore-Index publiziert.
Versionierung
| Version | Datum | Ănderungen |
|---|---|---|
| v0.1 | 2026-05-15 | Initialer Entwurf, 10 Dimensionen, Gleichgewicht. Pre-Review. |
Jede zukĂŒnftige Version wird hier dokumentiert mit Diff zur Vorversion. Methodik-Ănderungen sind transparent rĂŒckwirkend nachvollziehbar.
Lizenz
Methodik-Paper: CC BY 4.0 (Namensnennung). Daten: CC BY 4.0. Code (spÀter): MIT.
Jeder kann die Methodik adaptieren â aber nur AmtsGuide veröffentlicht den offiziellen AmtsScore-Index.