Ingen adgang til nyhedssites

Incident Report for Technology - News

Postmortem

Hvad skete der?

Jeg lavede en Ansible playbook specifikt til udrulning af firewall-regler på fysiske servere. Men jeg glemte i øjeblikket, at vi IKKE udruller firewall-regler på Proxmox nodes (vores virtualiseringsservere) med Ansible. Deres firewall-regler er i stedet konfigureret direkte i Proxmox' admin interface.

Den fejlagtige udrulning af firewall-regler medførte at det meste ind- og udgående trafik til og fra vores virtualiseringsmiljø blev blokeret. Inkl. storage-trafik og trafik til/fra virtuelle maskiner.

Hvordan løste vi problemet?

Da jeg samtidig lavede andet serverarbejde (opgraderinger) tog det mig noget tid før jeg forstod præcis hvad der forårsagede problemet. Vores jump hosts kunne heller ikke anvendes (de er virtuelle), og jeg måtte gå i serverrummet for at diagnosticere og løse problemet.

Selve løsningen var ikke så svær: Skift alle Proxmox nodes til at bruge en ACCEPT policy for INPUT/FORWARD/OUTPUT trafik. En pve-firewall restart kunne nok også have løst problemet.

Virtualiserede databaseservere i cluster (miscdb/timescaledb) skulle genstartes manuelt og CephFS filsystemer skulle remountes.

De fleste tjenester var nede i en times tid.

Siden har jeg rullet den fejlagtige firewall-konfiguration tilbage og genindlæst Proxmox firewallen.

Hvordan undgås en gentagelse?

For at forhindre en gentagelse, har jeg tilføjet logik til vores Ansible roller, som forhindrer, at vi udruller firewall-regler på Proxmox miljøet.

Posted Nov 03, 2025 - 15:20 CET

Resolved

Der er nu ryddet op, og vi kører stabilt igen.
Posted Nov 03, 2025 - 12:28 CET

Monitoring

Alle services er nu oppe. Vi overvåger.
Posted Nov 03, 2025 - 11:29 CET

Identified

Fejlen er identificeret og vi er i gang med at genetablere berørte systemer.
Posted Nov 03, 2025 - 11:16 CET

Investigating

We are currently investigating this issue.
Posted Nov 03, 2025 - 10:22 CET
This incident affected: Web applikationer (Dagblade, Erhverv+, Ugeaviser), Indholdsproduktion - Kodus CMS, Jourbox og Distributionsplugin, Købsproces & Selvbetjening (ARIA), Mobil Applikationer (iOS + Android), JFM ID (Login), and Kodus API.