DATENSATZ
Daten & Downloads
SynPop-DE stellt 40.235.916 synthetische Haushalte und 81.629.116 Personen in allen 400 deutschen Kreisen bereit — im offenen Parquet-Format, direkt lesbar mit DuckDB, pandas oder R.
Downloads
400 Parquet-Dateien — je ein Kreis — plus den vollständigen Gesamtdatensatz. Direkt streambar mit DuckDB, pandas oder R.
Download nach Kreis
Alle 45 Attribute je Person und Haushalt. Dateigröße: ca. 15–30 MB pro Kreis.
Gesamtdatensatz
Alle 400 Kreise in einer Datei. Empfohlen für kreisübergreifende Analysen.
DuckDB überträgt via HTTPS nur die benötigten Spalten und Zeilen. Für pandas/R pro-Kreis-Dateien verwenden.
CSV-Format nur pro Kreis verfügbar (Bereich oben). Der Gesamtdatensatz ist als Parquet oder via DuckDB-Streaming verfügbar.
Maschinenlesbar: catalog.json · DOI: 10.5281/zenodo.20439915
Direktzugriff & Streaming
Parquet-Dateien direkt aus der URL lesen — DuckDB überträgt per Byte-Range-Request nur die benötigten Daten.
Für gefilterten oder programmatischen Export — fertige CSV-Dateien stehen im Bereich „Download nach Kreis" (oben) bereit.
Datenvorschau
Wähle einen Kreis und erkunde 10 Beispieldatensätze — eine Zeile je Person, mit allen Haushaltsattributen.
AGS-Nummer eingeben oder Kreisnamen tippen und aus der Liste wählen.
| Haushalt | Personen | |||||||
|---|---|---|---|---|---|---|---|---|
| AGS | Gebäudetyp | Wohnfläche (m²) | Haushaltseinkommen (€/Jahr) | Altersgruppe | Geschlecht | Bildung | ||
| Keine Zeilen für diesen Kreis. | ||||||||
Datenschema
Alle 45 Spalten in den Parquet-Dateien — ein Eintrag je Person, Haushaltsattribute werden innerhalb des Haushalts geteilt.
| Spalte | Ebene | Typ | Beschreibung / Werte |
|---|---|---|---|
| Identifikatoren | |||
household_id | ID | string | Eindeutige Haushalt-ID |
person_id | ID | string | Eindeutige Personen-ID |
person_rank | ID | int | Rang innerhalb des Haushalts (1 = Hauptperson) |
ags | ID | string | AGS-Kreisschlüssel (5-stellig, z.B. „11000" für Berlin) |
state | ID | int | Bundesland-Code — 1–16 |
region_type | ID | int | BKG-Siedlungstyp — 1=Kernstadt, 2=ländlicher Kreis, 3=ländlicher Raum |
original_household_id | ID | string | Zeilenindex im GAN-generierten Donor-Pool (State-Region). Kein Bezug zu EVS-Umfrageteilnehmern. |
source_household_id | ID | string | Identisch mit original_household_id (Donor-Pool-Index, beide Spalten sind immer gleich) |
| Personenmerkmale | |||
gender | Person | int | Geschlecht — 1=männlich, 2=weiblich |
age_group | Person | int | Altersgruppe — 0=0–5, 1=6–14, 2=15–17, 3=18–29, 4=30–44, 5=45–59, 6=60–74, 7=75+ |
education | Person | int | Bildungsabschluss — 1=kein Abschluss, 2=Hauptschule, 3=Realschule, 4=Berufsausbildung, 5=Hochschule |
employment | Person | int | Erwerbsstatus — 1=erwerbslos, 2=Teilzeit, 3=Vollzeit, 4=Beamte/r, 5=Selbstständig |
| Haushaltsmerkmale | |||
household_size | Haushalt | int | Anzahl Personen im Haushalt |
household_type | Haushalt | int | Haushaltstyp — 1=Alleinstehend, 2=Paar, 3=Alleinerziehend, 4=Paar+Kinder, 5=Sonstiger |
household_type_27 | Haushalt | int | Haushaltstyp (5 Kategorien, identisch mit household_type nach Harmonisierung — Name ist historisches Artefakt des EVS-Rohvariablen) |
building_type | Haushalt | int | Gebäudetyp — 1=Einfamilienhaus, 2=Doppelhaus, 3=Mehrfamilienhaus, 4=Sonstiges |
building_ownership | Haushalt | int | Eigentümerschaft — 1=Eigentümer, 2=Mieter |
building_age | Haushalt | int | Baualtersklasse — 1=vor 1949, 2=1949–1978, 3=1979–2001, 4=nach 2001 |
building_size | Haushalt | float | Wohnfläche in m² |
heating_type | Haushalt | int | Heizungsart — 1=Fernwärme, 2=Zentralheizung, 3=Einzelofen |
heating_energy | Haushalt | int | Primärer Energieträger — 0=keine, 1=Strom, 2=Gas, 3=Heizöl, 4=Festbrennstoffe, 5=Erneuerbare |
household_income | Haushalt | int | Einkommensklasse (Destatis-Klassifikation, 10 Stufen) — 1 (niedrig) bis 10 (hoch) |
household_income_num | Haushalt | float | Jährliches Nettoeinkommen in € |
aeq | Haushalt | float | Äquivalenzeinkommen (OECD-Skala) in €/Jahr |
exp_quota | Haushalt | float | Konsumquote — Verhältnis der Jahresausgaben zum Jahres-Nettoeinkommen des Haushalts |
| Ausgaben (€/Jahr) | |||
expenditure | Haushalt | float | Gesamte Jahresausgaben des Haushalts in EUR (Summe aller Ausgabenkategorien nach Kalibrierung) |
exp_food | Haushalt | float | Ernährung und alkoholfreie Getränke |
exp_clothes | Haushalt | float | Bekleidung und Schuhe |
exp_housing_total | Haushalt | float | Wohnen gesamt |
exp_housing_rent | Haushalt | float | Miete (Mieter) oder imputierter Mietwert (Eigentümer) |
exp_housing_electricity | Haushalt | float | Strom |
exp_housing_heating | Haushalt | float | Heizkosten |
exp_housing_imputed | Haushalt | float | Imputierter Mietwert (nur Eigentümer) |
exp_housing_maintenance | Haushalt | float | Instandhaltung und Reparatur |
exp_transport_total | Haushalt | float | Mobilität gesamt |
exp_transport_fuel | Haushalt | float | Kraftstoff |
exp_transport_own | Haushalt | float | Fahrzeuganschaffung und Leasing |
exp_transport_public | Haushalt | float | Öffentlicher Nahverkehr |
exp_health | Haushalt | float | Gesundheit |
exp_leisure | Haushalt | float | Freizeit und Kultur |
exp_telecom | Haushalt | float | Telekommunikation |
exp_furniture | Haushalt | float | Einrichtung und Hausrat |
exp_hospitality | Haushalt | float | Gaststätten und Beherbergung |
exp_education | Haushalt | float | Bildung |
exp_other | Haushalt | float | Sonstige Ausgaben |