Nextcloud: Wenn die Datenbank zum Flaschenhals wird – eine Anleitung zur systematischen Optimierung

Nextcloud hat sich längst vom reinen Filehosting-Dienst zum de-facto Standard für selbstgehostete Collaboration-Plattformen gemausert. Kalender, Kontakte, Talk, Mail, Deck – die Erweiterungen sind praktisch, doch sie treiben die Komplexität der zugrundeliegenden Architektur in die Höhe. Im Zentrum steht dabei fast immer eine unscheinbare Komponente: die Datenbank. Während Admins oft akribisch an Speicherplatz, RAM oder CPU-Feinschliff drehen, wird das relationale Herzstück der Nextcloud-Instanz gerne vernachlässigt. Bis es stolpert.

Dabei zeigt sich ein klares Muster: Die Performance-Probleme einer wachsenden Nextcloud-Installation sind in über neun von zehn Fällen keine Problems des Dateisystems oder der PHP-Konfiguration, sondern schlichtweg Datenbankengpässe. Ladezeiten in der Weboberfläche, die sich in die Länge ziehen, hängende Synchronisationen der Desktop-Clients oder Zeitüberschreitungen beim Versand großer Shares – all das sind klassische Symptome einer überlasteten oder suboptimal konfigurierten Datenbank. Dieser Artikel widmet sich nicht oberflächlichen Quick-Fixes, sondern einer systematischen Analyse und Optimierung der Nextcloud-Datenbank. Ziel ist ein verständliches, praxisnahes Vorgehen für Administratoren, die ihre Instanz auch bei wachsender Nutzerzahl und Datenmenge stabil und flott halten wollen.

Das Fundament verstehen: Wie Nextcloud mit der Datenbank spricht

Bevor man an Schrauben dreht, muss man das Uhrwerk kennen. Nextcloud ist im Kern eine PHP-Anwendung, die mittels Doctrine Database Abstraction Layer (DBAL) auf die Datenbank zugreift. Sie nutzt keine hochkomplexen, verschachtelten SQL-Statements, aber eine Unmenge an relativ einfachen Abfragen. Jeder Klick in der Web-Oberfläche, jeder Sync-Vorgang des Clients löst eine Kaskade von SELECT-, INSERT- und UPDATE-Befehlen aus. Die Datenbank ist dabei weniger ein passives Archiv, sondern ein hochdynamisches System, das ständig Metadaten verwaltet: Datei- und Ordnerstrukturen, Share-Permissions, Aktivitätsstreams, Versionsinformationen, Vorschau-Caches, App-spezifische Einstellungen.

Ein interessanter Aspekt ist die Architektur der `oc_filecache`-Tabelle, dem zentralen Metadaten-Speicher für das virtuelle Dateisystem. Sie repräsentiert den gesamten Baumbau aller Nutzerdateien und -ordner. Jeder Eintrag enthält Pfad, Größe, Berechtigungen, MIME-Typ und eine Referenz auf den physischen Speicherort. Wächst die Instanz auf Millionen von Dateien, wächst diese Tabelle entsprechend – und wird zum häufigsten Performance-Kandidaten. Ähnlich kritisch sind die Tabellen `oc_activity`, `oc_share`, `oc_comments` und `oc_deck_cards` (sofern genutzt). Sie sind hochtransaktional und werden bei aktiver Nutzung pausenlos geschrieben und gelesen.

Die Wahl des Datenbank-Backends – üblicherweise MariaDB/MySQL oder PostgreSQL – ist dabei nicht trivial. Während MySQL-Derivate oft aus der LAMP-Tradition kommen, punktet PostgreSQL bei komplexeren Abfragen und unter hoher Last mit einem oft als robuster beschriebenen Optimizer. Nextcloud selbst gibt hier kein klares Mandat, doch die Feinjustierung unterscheidet sich deutlich.

Die Diagnose: Wo genau hakt es denn?

Blindes Optimieren ist Zeitverschwendung. Der erste Schritt muss immer eine präzise Diagnose sein. Nextcloud bietet mit dem `occ`-Tool einen eingebauten Performance-Tester (`occ db:analyze`), der einen guten ersten Eindruck liefert. Er prüft Schlüsseltabellen auf Indizes und gibt Warnungen aus. Nützlich, aber nur die Spitze des Eisbergs.

Die eigentliche Wahrheit findet sich in den Logs und im Live-Monitoring der Datenbank. Für MySQL/MariaDB ist das langsame Query-Log (`slow_query_log`) ein unverzichtbarer Verbündeter. Aktiviert man es mit einer sinnvollen Schwellwert (z.B. 2 Sekunden), protokolliert es jede Abfrage, die länger dauert. Die Auswertung dieser Logs zeigt exakt, welche Statements die Performance fressen. Tools wie `pt-query-digest` von Percona parsen diese Logs und aggregieren die Ergebnisse, sodass man sofort die häufigsten und langsamsten Übeltäter identifiziert.

Bei PostgreSQL übernimmt das `pg_stat_statements`-Modul eine ähnliche Rolle. Es sammelt Statistiken zu allen ausgeführten SQL-Befehlen. Eine Abfrage wie `SELECT query, calls, total_time, mean_time FROM pg_stat_statements ORDER BY mean_time DESC LIMIT 10;` zeigt sofort die größten Zeitfresser. Zusätzlich lohnt der Blick in die Nextcloud-Eigenen Logs (`data/nextcloud.log`). Datenbankfehler oder Timeouts sind hier meist klar gekennzeichnet und geben Hinweise auf zugrundeliegende Probleme wie Lock-Konflikte.

Nicht zuletzt ist das Monitoring der Systemressourcen entscheidend: Ist die CPU der Datenbankmaschine dauerhaft ausgelastet? Wartet der Datenbankprozess hauptsächlich auf I/O (Festplattenzugriffe)? Hohe I/O-Wait-Zeiten deuten stark auf unzureichende Indizes oder zu kleine Speicherpuffer hin. Der Datenbank-Server sollte idealerweise genügend RAM haben, um den gesamten „working set“ – also die häufig benötigten Daten und Indizes – im Speicher zu halten. Läuft die Datenbank hingegen ständig an die Platte, ist sie faktisch zum Stillstand verdammt.

Der klassische Hebel: Indizes richtig setzen und pflegen

Das mit Abstand effektivste Mittel zur Performance-Steigerung ist der gezielte Einsatz von Datenbank-Indizes. Stellen Sie sich einen Index wie das Inhaltsverzeichnis eines dicken Buches vor: Ohne ihn müssten Sie jede Seite durchblättern, um einen bestimmten Begriff zu finden. Mit ihm springen Sie direkt zur richtigen Stelle. Nextcloud legt bei der Installation eine Grundmenge an Indizes an, die für den Startbetrieb ausreichen. Mit wachsender Datenmenge und Nutzung der Collaboration-Apps reichen diese oft nicht mehr aus.

Typische Kandidaten für fehlende Indizes sind Abfragen mit `WHERE`-Klauseln auf Spalten, die nicht primär geordnet sind, oder `JOIN`-Operationen. Die `oc_filecache`-Tabelle wird oft nach `path` oder `parent` durchsucht. Ein zusammengesetzter Index auf `(storage, path_hash)` kann hier Wunder wirken, da Nextcloud intern oft mit `path_hash` arbeitet. Die `oc_activity`-Tabelle, die bei vielen Nutzern unaufhaltsam wächst, braucht zwingend einen Index auf `affecteduser` und `timestamp`, um die Übersichtsseiten schnell zu laden.

Doch Vorsicht: Indizes sind kein kostenloses Mittagessen. Jeder Index verlangsamt `INSERT`-, `UPDATE`- und `DELETE`-Operationen, da er mitgeführt werden muss. Zudem belegen sie Speicherplatz. Die Kunst liegt darin, die richtigen Indizes für die tatsächlichen Zugriffsmuster zu finden. Hier kommt die Analyse der langsamen Queries ins Spiel. Ein Beispiel: Trödelt eine Abfrage auf `oc_share` mit `WHERE share_with = ? AND share_type = ?`, ist ein Index auf genau diese beiden Spalten der direkteste Lösungsweg.

Die Index-Wartung sollte auch nicht vernachlässigt werden. Bei MySQL/MariaDB fragmentieren Indizes über Zeit, besonders bei Tabellen mit vielen Updates. Ein regelmäßiges `OPTIMIZE TABLE ` (am besten während einer Wartungsperiode) kann die Performance wiederherstellen. Bei PostgreSQL übernimmt der `VACUUM`-Prozess (ideal autovacuum) diese Aufgabe. Ein manuelles `REINDEX` kann bei stark fragmentierten Indizes notwendig sein.

Konfiguration: Vom Default zum Fine-Tuning

Die Standardkonfiguration einer MySQL- oder PostgreSQL-Installation ist auf Kompatibilität und geringen Ressourcenverbrauch ausgelegt – nicht auf den Betrieb einer unter Last stehenden Nextcloud-Instanz. Hier muss nachjustiert werden.

Für MySQL/MariaDB stehen die `innodb`-Einstellungen im Fokus. Der `innodb_buffer_pool_size` ist der wichtigste Parameter überhaupt. Er definiert, wie viel RAM für Daten und Indizes im Speicher gehalten wird. Eine Faustregel: 70-80% des verfügbaren Serverspeichers (auf einer dedizierten DB-Maschine) sollten hier landen. Bei 16 GB RAM also etwa 12 GB. Zu klein gewählt, und es gibt ständiges Swapping auf die Festplatte; zu groß, und dem Betriebssystem bleibt kein RAM mehr für andere Aufgaben. `innodb_log_file_size` sollte großzügig (z.B. 1-2GB) dimensioniert sein, um viele Transaktionen zwischenzuspeichern und teure Schreibvorgänge zu reduzieren. `max_connections` muss hoch genug sein für die erwartete Anzahl gleichzeitiger Nextcloud-Webzugriffe und synchronisierender Clients (300-500 sind für mittlere Instanzen kein ungewöhnlicher Wert).

Für PostgreSQL sind `shared_buffers` (das Äquivalent zum InnoDB Buffer Pool) und `work_mem` entscheidend. `shared_buffers` wird oft niedriger als bei MySQL angesetzt (z.B. 25% des RAM), da PostgreSQL zusätzlich auf das Betriebssystem-Caching setzt. `work_mem` beeinflusst, wie viel Speicher für Sortier- und Hash-Operationen pro Abfrage zur Verfügung steht. Ein zu niedriger Wert zwingt die Datenbank, auf langsame temporäre Dateien auf der Festplatte auszuweichen. `maintenance_work_mem` sollte für Wartungsjobs wie `VACUUM` oder Index-Erstellungen deutlich höher sein. Die `max_connections` müssen auch hier angepasst werden.

Ein oft übersehener Nextcloud-interner Parameter ist `dbplatform` in der `config.php`. Für PostgreSQL kann `’dbplatform‘ => ‚pgsql’` gesetzt werden, um PostgreSQL-spezifische Optimierungen im Query-Builder zu aktivieren. Das kann subtile, aber spürbare Verbesserungen bringen.

Die Säuberung: Datenhygiene als kontinuierlicher Prozess

Nextcloud produziert Metastrukturdaten in einem erstaunlichen Tempo. Viele dieser Daten werden nach einer gewissen Zeit obsolet, bleiben aber in der Datenbank. Eine regelmäßige Säuberung entlastet die Tabellen spürbar und beschleunigt Backups sowie Wartungsoperationen.

Der offensichtlichste Ansatz ist die Aktivierung der eingebauten Hintergrundjobs in der `config.php`: `’maintenance_window_start‘ => 1,` (für 1 Uhr Nachts). Nextcloud führt dann in diesem Fenster automatisch Aufgaben wie das Stutzen der Aktivitäts- und Versions-Tabellen durch. Die Aufbewahrungszeiten können in den Einstellungen der entsprechenden Apps (Aktivität, Dateiversionen) konfiguriert werden. Dateiversionen sind ein zweischneidiges Schwert: Sie bieten Sicherheit, aber jede Änderung erzeugt eine neue Version. Eine sinnvolle Aufbewahrungspolitik (z.B. „max. 5 Versionen pro Datei, älter als 1 Jahr automatisch löschen“) ist essentiell.

Für tiefgreifendere Reinigungen bietet das `occ`-Tool mächtige Kommandos. `occ db:convert-filecache-bigint` ist ein einmaliger, aber wichtiger Schritt für ältere Installationen, die noch mit Integer-IDs arbeiten – es wechselt auf `BIGINT` und beugt so Überläufen vor. Die manuelle Prüfung und gegebenenfalls Löschung verwaister Einträge in `oc_filecache` (nach dem Löschen von externen Speichern) oder `oc_storages` kann Tabellen verkleinern.

Besonderes Augenmerk gilt den Preview-Bildern. Jede Bild- und PDF-Datei generiert Miniaturansichten, deren Metadaten in der Datenbank landen. Bei Millionen von Dateien kann die `oc_preferences`-Tabelle (die unter anderem UI-Einstellungen speichert) unerwartet groß werden. Ein manuelles Aufräumen via SQL sollte hier aber mit äußerster Vorsicht geschehen und nur mit einem aktuellen Backup.

Fortgeschrittene Strategien: Partitionierung und Read-Replicas

Wenn klassische Optimierung nicht mehr ausreicht, muss die Architektur angepasst werden. Für sehr große Nextcloud-Instanzen (ab mehreren Tausend aktiven Nutzern) lohnt der Blick auf zwei fortgeschrittene Techniken: Die Partitionierung von Tabellen und die Einführung von Read-Replicas.

Partitionierung bedeutet, eine große logische Tabelle (wie `oc_activity`) in viele kleinere, physikalische Untertabellen aufzuteilen, beispielsweise nach Datum. Eine Abfrage nach den neuesten Aktivitäten muss dann nicht mehr den gesamten, riesigen Datenbestand durchsuchen, sondern nur noch die Partition der letzten Tage. Dies kann die Performance um Größenordnungen verbessern. Vor allem bei zeitlich geordneten Daten mit natürlichem Verfall (Aktivitäten, Logs) ist Partitionierung nach `timestamp` ein Königsweg. Nachteil: Die Einrichtung ist manuell, erfordert tiefere Datenbankkenntnisse und wird von Nextcloud nicht offiziell unterstützt. Ein Fehler kann die Instanz lahmlegen.

Die Einrichtung von Read-Replicas ist ein Skalierungsansatz für hochfrequente Lesezugriffe. Dabei wird die Schreiblast (alle `INSERT`, `UPDATE`, `DELETE`) auf eine primäre Datenbank (Master) gerichtet. Diese repliziert ihre Änderungen asynchron auf eine oder mehrere sekundäre Datenbanken (Replicas), die ausschließlich für Leseabfragen (`SELECT`) genutzt werden. In Nextcloud-Kontext könnte man theoretisch die Last der Weboberfläche (viele Lesezugriffe auf Dateilisten, Aktivitäten) auf ein Replica verteilen, während die Synchronisations-Clients (die viele Schreibvorgänge verursachen) auf den Master schreiben. Die Umsetzung ist jedoch alles andere als trivial. Nextclouds Codebase ist nicht primär für getrennte Lese-/Schreib-Verbindungen designed. Mit Tricks wie MySQLs `maxscale` oder ProxySQL könnte man Transparent-Proxy-Layer dazwischenschalten, die Abfragen automatisch aufteilen. Das ist jedoch Operation auf Expertenniveau und erhöht die Komplexität der gesamten Infrastruktur erheblich.

Der PostgreSQL-Sonderfall: Spezifische Stärken nutzen

PostgreSQL-Benutzer haben einen anderen Werkzeugkasten zur Verfügung. Die bereits erwähnten `pg_stat_statements` sind Gold wert. Darüber hinaus bietet PostgreSQL mächtige Index-Typen, die bei Nextcloud hilfreich sein können. BRIN-Indizes (Block Range INdex) zum Beispiel sind ideal für sehr große, zeitlich sortierte Tabellen wie `oc_activity`. Sie benötigen nur einen Bruchteil des Speicherplatzes eines normalen B-Tree-Index und beschleunigen Range-Queries auf `timestamp`-Spalten dennoch enorm.

Die automatische Wartung via `autovacuum` ist bei PostgreSQL ausgefeilter, muss aber überwacht werden. Bei extrem schreibintensiven Tabellen kann `autovacuum` hinterherhinken, was zu Tabellenaufblähung („bloat“) und verschlechterter Performance führt. Hier muss man unter Umständen die Parameter für `autovacuum_vacuum_scale_factor` und `autovacuum_vacuum_threshold` für spezifische Tabellen anpassen oder manuelle `VACUUM`-Läufe in ruhigen Zeiten einplanen.

Ein praktischer Tipp für PostgreSQL: Die `oc_filecache`-Tabelle hat eine `size`-Spalte. Abfragen, die nach großen Dateien suchen („Zeig mir alle Dateien > 500MB“), können von einem Index auf `size` profitieren, wenn solche Reports regelmäßig laufen. Die Wahl des richtigen Index-Typs (hier klassisch B-Tree) ist entscheidend.

Monitoring und langfristige Pflege

Optimierung ist kein einmaliges Projekt, sondern ein kontinuierlicher Prozess. Ein einfaches, aber effektives Monitoring-Setup ist unerlässlich. Neben den bereits genannten Datenbank-Metriken (langsame Queries, Verbindungen, I/O Wait) sollten auch Nextcloud-spezifische Werte überwacht werden: Die Laufzeit der `cron.php`-Jobs (sie führen viele DB-Operationen aus), die Anzahl der Dateioperationen pro Sekunde und die Antwortzeiten der Web-Oberfläche.

Tools wie Prometheus mit Exporters (z.B. `mysqld_exporter`, `postgres_exporter`) und einer Visualisierung via Grafana bieten hier professionelle Einblicke. Man kann Dashboards erstellen, die den Buffer-Pool-Auslastungsgrad, die Replikationsverzögerung (bei Replicas) oder die Wachstumsrate der wichtigsten Tabellen darstellen. Ein plötzlicher Anstieg der durchschnittlichen Query-Zeit ist sofort sichtbar und kann proaktiv untersucht werden, bevor die Nutzer sich beschweren.

Regelmäßige, getestete Backups sind vor jeder manuellen Optimierungsaktion obligatorisch. Ein falsch gesetzter Index oder ein fehlerhaftes `DELETE`-Statement kann die Produktivinstanz ruinieren. Das Backup- und Recovery-Prozedere muss sitzen. Für MySQL bietet sich `mydumper`/`myloader` an, für PostgreSQL `pg_dump`/`pg_restore` in einem geeigneten Format. Dabei nicht vergessen: Ein konsistentes Backup einer Nextcloud-Instanz umfasst immer die Datenbank UND das `data/`-Verzeichnis mit den Dateien, idealerweise atomar oder zumindest aus einem konsistenten Zustand.

Fazit: Stabilität durch Verständnis

Die Nextcloud-Datenbank ist das unsichtbare Rückgrat der gesamten Plattform. Ihre Performance entscheidet maßgeblich über die Nutzererfahrung und die Skalierbarkeit der Installation. Eine pauschale „Optimierungs-Checkliste“ gibt es nicht, da jede Instanz ihr eigenes Nutzungsprofil hat. Der Weg führt stattdessen über systematisches Vorgehen: Erst verstehen, wie Nextcloud die Datenbank nutzt. Dann messen, wo die Engpässe konkret liegen. Anschließend gezielt eingreifen – mit Indizes, Konfigurationsanpassungen und Säuberungsroutinen.

Die fortgeschrittenen Techniken wie Partitionierung oder Replikation sind mächtig, aber sie kommen mit erheblicher Komplexitätssteigerung. Für die allermeisten Unternehmens- und Community-Instanzen bis zu einigen hundert aktiven Nutzern sind sie Overkill. Hier reichen oft schon eine Handvoll gut platzierter Indizes, eine an die Hardware angepasste `my.cnf` oder `postgresql.conf` und ein konsequentes Aufräumen alter Daten.

Letztlich ist die beste Optimierung die, die nicht auffällt. Eine gut laufende Nextcloud-Instanz fühlt sich für den Endnutzer einfach nur schnell und zuverlässig an. Der Admin, der sich die Zeit genommen hat, das Datenbank-Backend zu verstehen und zu pflegen, kann sich dann zurücklehnen und sich um andere Dinge kümmern – bis die nächste Wachstumskurve neue Herausforderungen bringt. Denn Stillstand gibt es in der IT bekanntlich nicht.

Nextcloud Datenbank optimieren für mehr Performance