Logo Krebsregister Niedersachsen
zur Karte

Statistische Methoden

Altersstandardisierte Inzidenzrate (ASR)

Die Berechnung der altersstandardisierten Inzidenzrate erfolgt mittels der direkten Altersstandardisierung. Hierfür werden die altersspezifischen Raten (je Altersgruppe, Geschlecht und Region) mit dem Anteilswerten der jeweiligen Bevölkerungsgruppe in der Standardpopulation gewichtet. Für den Krebsatlas wurde der alte Europastandard (Doll & Cook, 1967) als Standardpopulation verwendet. Für jede ReBe werden die jährlichen Fälle je 100.000 Personen, gemittelt über den ausgewählten Zeitraum (5- bzw. 10-Jahres-Zeitraum), ausgewiesen.

Standardisierte Inzidenzverhältnis (standardized incidence ratio, SIR)

Das standardisierte Inzidenzverhältnis (SIR) wird berechnet, indem die die Zahl der in einer ReBe beobachteten Fälle ins Verhältnis gesetzt wird zur Zahl der Fälle, die sich bei der gegebenen Altersstruktur auf Grundlage der für ganz Niedersachsen (NDS) ermittelten altersspezifischen Inzidenzraten ergeben (indirekte Standardisierung). Der Wert ermöglicht einen unmittelbaren Vergleich der regionalen Erkrankungshäufigkeit mit der landesweiten. Anders als bei der ASR ist der Wert vom Alter der betroffenen Person unabhängig. Stichprobenschwankungen, die durch einzelne Fälle in schwach besetzte Altersgruppen entstehen, werden reduziert (Pickle, 2009).

Die folgende Formel wurde zur Berechnung der erwarteten Fälle EiE_i verwendet, wo ii die ReBe und α\alpha die altersspezifische Gruppe ist 1:

Ei=beobachtete Fa¨lle in NDSαBevo¨lkerung in NDSα×Bevo¨lkerung in ReBeα,iE_i = \sum \frac{\text{beobachtete Fälle in NDS}_\alpha}{\text{Bevölkerung in NDS}_\alpha} \times \text{Bevölkerung in ReBe}_{\alpha, i}

Das SIR ist der Quotient aus den beobachteten Krebsfällen und den erwarteten Krebsfällen einer ReBe. Das ungeglättete SIR wird im Krebsatlas aus datenschutzrechtlichen Gründen nicht dargestellt.

SIRi=beobachtete Krebsfa¨lleiEiSIR_i = \frac{\text{beobachtete Krebsfälle}_i}{E_i}

Räumliche Glättung

Aufgrund der natürlichen Schwankungen, die bei kleinen Fallzahlen in kleinräumigen geografischen Einheiten auftreten, wurde eine räumliche Glättung durchgeführt, um die Stabilität der Schätzer zu erhöhen. So können Gebiete mit sehr niedrigen Fallzahlen, die durch geringe Bevölkerungszahlen bedingt sind, besser mit Gebieten verglichen werden, die höhere Fallzahlen aufgrund größerer Bevölkerungszahlen aufweisen. Durch die räumliche Glättung „leihen“ sich Gebiete Informationen von ihren Nachbargebieten, was die Schätzung zuverlässiger macht. Dabei wird die zugrunde liegende Fallzahl geschätzt, anstatt nur die zufällige Variation zu berücksichtigen (Duncan et al., 2019). Zudem reduziert die Glättung die Auswirkungen der Arbitrarität der Grenzen, die die geografischen Einheiten definieren (Duncan et al., 2019). Für diesen Zweck werden Spatial Bayesian Disease Mapping (BDM) Modelle verwendet, die räumliche Abhängigkeiten berücksichtigen und stabile Schätzungen ermöglichen (Lawson, 2021).

BDM-Modelle enthalten zufällige Effekte, denen eine bedingte autoregressive (CAR) Prior-Verteilung zugewiesen wird (Lawson, 2021). Dieser Prior spiegelt die räumliche Autokorrelation zwischen geografischen Gebieten wider, wobei benachbarte Gebiete mehr korrelieren als weiter entfernte Gebiete (Duncan et al., 2019). Mithilfe der räumlichen Glättung werden die Posterior-Schätzungen in Richtung eines globalen und lokalen Mittelwerts verschoben, was die Schätzungen (auch bei kleinen Stichprobengrößen) stabilisiert und robustere Ergebnisse liefert (Duncan et al., 2019).

Die Schätzung in BDM-Modellen basiert auf einer Posterior-Verteilung, die sich aus einer Wahrscheinlichkeitsfunktion und den Prior-Verteilungen für Modellparameter ergibt (Lawson, 2021).

Die Posterior-Schätzungen werden mit Markov Chain Monte Carlo (MCMC) Methoden durchgeführt. Dabei wird die Posterior-Verteilung durch Stichproben approximiert. Die ermittelten Stichprobenwerte werden dann verwendet, um die Zielgrößen, z.B. die SIR, zusammenzufassen (Lawson, 2021).

Nachbarschaft

Durch die Implementierung einer Adjazenzmatrix in das BDM-Modell wird die räumliche Nähe zwischen den zufälligen Effekten für jedes Nachbarschaftspaar angegeben. Am häufigsten wird eine binäre Adjazenzmatrix erster Ordnung mit folgenden Elementen verwendet (Duncan et al., 2019):

wi,j={1,wenn Gebiet i und j adjazent sind,0,andernfalls.w_{i,j} =\left\{\begin{array}{ll}1, & \text{wenn Gebiet } i \text{ und } j \text{ adjazent sind,} \\ 0, & \text{andernfalls.}\end{array}\right.

Im Krebsatlas gelten benachbarte ReBe als adjazent, wenn sie mindestens einen Grenzpunkt teilen (Queen's Nachbarschaft) (Moraga, 2023).

Bayesianisches Hierarchiches Modell (BHM)

Inzidenz

In Anlehnung an den Australischen Krebsatlas wird das Leroux Modell zur Modellierung der Inzidenz verwendet (Duncan et al., 2019; Leroux et al., 2000). Das Inzidenzmodell ist gegeben durch:

YiPoisson(Eiθi),fu¨i=1,,366 ReBeY_i \sim \text{Poisson}(E_i \theta_i), \quad \text{für } i = 1, \dots, 366~\text{ReBe}

wo YiY_i die Anzahl beobachteter Krebsfälle in jeder ReBe ii ist. Die ertwartete Fallzahl (Ei)(E_i) wird durch indirekte Standadrisierung gebildet (siehe standardisiertes Inzidenzverhältnis), um für Populationsgröße und Altersstruktur zu adjustieren.

Die modellierte logarithmierte SIR θi\theta_i, enthält einen Y-Achsenabschnitt (β0)(\beta_0), und räumliche zufällige Effekte (Si)(S_i) in folgender Gleichung:

log(θi)=β0+Silog(\theta_i)=\beta_0+S_i

Als Prioren wurde eine Normalverteilung für den Achsenabschnitt (β0)(\beta_0) und ein Leroux-CAR-Prior für den räumlichen Effekt gewählt, der einen gewichteten Mittelwert aus unabhängigen Zufallseffekten und räumlichen Zufallseffekten (unter Berücksichtigung der Adjazenzmatrix und der räumlichen Autokorrelation zwischen den ReBes) ermöglicht (Duncan et al., 2019).

Unsicherheit

Glaubwürdigkeitsintervall (credible Intervals (CIs))

Zu den posterioren mittleren SIR-Werten jeder ReBe wird das Credible Interval (CI) gebildet. Das CI ist das 95%-Credible Interval, welche durch Perzentile (2,5, 97,5) der MCMC Schätzer gebildet wird. In der tabellarischen Darstellung wird das 95%-Credible Interval angegeben.

Posterior probability difference (PPD)

In Anlehnung an (Duncan et al., 2019) wird die Wahrscheinlichkeit, dass der Schätzer der jeweiligen ReBe vom Landesdurchschnitt abweicht, durch die PPD dargestellt. Hierfür wird für die jeweilige ReBe die Differenz aus den Anteilen der Stichproben, die über 1 liegen, und den Anteilen der Stichproben, die unter 1 liegen, berechnet. Bei einer PPD von ≥60% wird die Bewertung getroffen, dass die Abweichung des wahren Werts vom Landesdurchschnitt wahrscheinlich nicht durch Zufall bedingt ist.

V-Plot

Geglättete SIR-Werte mit der dazugehörigen PPD für alle ReBe sind basierend auf (Duncan et al., 2019) mithilfe des V-Plots visualisiert. Der V-Plot zeigt, wie stark das Inzidenzverhältnis eines Gebiets vom Landesdurchschnitt (horizontale Achse) abweicht und wie zuverlässig diese Abweichung ist (vertikale Achse). Je höher Werte am oberen Ende der y-Achse liegen, desto größer ist die Wahrscheinlichkeit, dass es sich um eine nicht durch Zufall bedingte Abweichung vom Landesdurchschnitt handelt.

Sina plots

Weitere Kennzahlen wie bspw. der Deprivationsidex werden durch Sina plots dargestellt. Jede Kategorie der Kennzahl (bspw. jedes Deprivationsquintil) erhält einen Sina plot, der neben der Dichteverteilung der Daten auch die einzelnen Datenpunkte der ReBes zeigt (Sidiropoulos et al., 2015). Die Breite des Sina plots gibt zudem an, wie viele ReBes in der jeweiligen Kategorie vorhanden sind (Sidiropoulos et al., 2015).

Datenquellen

Der Datenabzug umfasst alle berücksichtigten Diagnosen und wurde zentral aus dem Epidemiologischen Krebsregister Niedersachsen erstellt. Dieses Register erfasst alle gesicherten Krebsdiagnosen, die bei Einwohnerinnen und Einwohnern Niedersachsens gestellt werden. Die Meldung erfolgt durch Ärztinnen und Ärzte, Krankenhäuser und pathologische Institute gemäß den gesetzlichen Vorgaben. Das Sterbedatum erhält das Krebsregister von den Einwohnermeldeämtern.

Erfasst werden unter anderem:

  • Zeitpunkt der Diagnose

  • Tumorart und Lokalisation

  • Stadium und histologische Merkmale

  • Sterbedatum (falls zutreffend)

Die Daten werden regelmäßig geprüft, qualitätsgesichert und für die Auswertung vorbereitet. Die Auswertungen der ASR und SIR enthalten DCO-Fälle (Death certificate only; Fälle die dem Register ausschließlich durch Todesbescheinigungen bekannt geworden sind).

Die im Atlas dargestellten Auswertungen basieren auf dem Datenstand vom 1. Juli 2025.

Der Niedersächsische Index Multipler Deprivation (NIMD) wurde durch das Department für Versorgungsforschung der Carl von Ossietzky Universität Oldenburg zur Verfügung gestellt (Hans, Schwettmann, et al. 2026, Unpublished manuscript) und beruht auf dem German Index of Multiple Deprivation (GIMD). Der GIMD wurde ursprünglich von W. Maier, J. Fairburn und A. Mielck entwickelt. GIMD und NIMD erfassen die Benachteiligung auf regionaler Ebene anhand von sieben Domänen: Einkommen, Beschäftigung, Bildung, Sozialkapital, Kommunale Einnahmen, Umwelt und Sicherheit.
Die Regionstypen stammen aus dem Bundesinstitut für Bau-, Stadt- und Raumforschung (BBSR).

Computation

Die Inzidenzmodelle wurden in R (version 4.4.3) mit dem CarBayes Paket implementiert (Lee, 2013). Die Modellierung des Überlebens wurde mit dem popEpi (Miettinen & Rantanen, 2025) und OpenBugs (Sturtz et al., 2005) Paket durchgeführt.

Model fit

Der Model fit wurde mithilfe von Visualisierungen beurteilt. In einem Scatterplot wurden die medianen geglätteten SIRs und beobachtete SIRs nach gerankter ReBe visualisiert, um die Glättung gegen die SIR von 1 aufzuzeigen.

Referenzen

Doll, R., & Cook, P. (1967). Summarizing indices for comparison of cancer incidence data. International Journal of Cancer, 2(3), 269–279. https://doi.org/10.1002/ijc.2910020310
Duncan, E. W., Cramb, S. M., Aitken, J. F., Mengersen, K. L., & Baade, P. D. (2019). Development of the Australian Cancer Atlas: spatial modelling, visualisation, and reporting of estimates. International Journal of Health Geographics, 18(1). https://doi.org/10.1186/s12942-019-0185-9
Lawson, A. B. (2021). Using R for Bayesian Spatial and Spatio-Temporal Health Modeling. https://doi.org/10.1201/9781003043997
Lee, D. (2013). CARBayes: An R Package for Bayesian Spatial Modeling with Conditional Autoregressive Priors. Journal of Statistical Software, 55(13), 1–24. https://doi.org/10.18637/jss.v055.i13
Leroux, B. G., Lei, X., & Breslow, N. (2000). Estimation of Disease Rates in Small Areas: A new Mixed Model for Spatial Dependence (pp. 179–191). Springer New York. https://doi.org/10.1007/978-1-4612-1284-3_4
Miettinen, J., & Rantanen, M. (2025). popEpi: Functions for Epidemiological Analysis using Population Data. https://CRAN.R-project.org/package=popEpi
Moraga, P. (2023). Spatial Statistics for Data Science. https://doi.org/10.1201/9781032641522
Pickle, L. W. (2009). A history and critique of U.S. mortality atlases. Spatial and Spatio-Temporal Epidemiology, 1(1), 3–17. https://doi.org/10.1016/j.sste.2009.07.004
Sidiropoulos, N., Sohi, S. H., Rapin, N., & Bagger, F. O. (2015). SinaPlot: an enhanced chart for simple and truthful representation of single observations over multiple classes. http://dx.doi.org/10.1101/028191
Sturtz, S., Ligges, U., & Gelman, A. (2005). R2WinBUGS: A Package for Running WinBUGS from R. 12. http://www.jstatsoft.org

Fußnoten

  1. https://iknl.nl/kankeratlas/statistische-methoden