DATENSATZ

Daten & Downloads

SynPop-DE stellt 40.235.916 synthetische Haushalte und 81.629.116 Personen in allen 400 deutschen Kreisen bereit — im offenen Parquet-Format, direkt lesbar mit DuckDB, pandas oder R.

82MSynthetische Personen
40MHaushalte
400Kreise

Downloads

400 Parquet-Dateien — je ein Kreis — plus den vollständigen Gesamtdatensatz. Direkt streambar mit DuckDB, pandas oder R.

Download nach Kreis

Alle 45 Attribute je Person und Haushalt. Dateigröße: ca. 15–30 MB pro Kreis.

    Gesamtdatensatz

    Alle 400 Kreise in einer Datei. Empfohlen für kreisübergreifende Analysen.

    DuckDB überträgt via HTTPS nur die benötigten Spalten und Zeilen. Für pandas/R pro-Kreis-Dateien verwenden.

    CSV-Format nur pro Kreis verfügbar (Bereich oben). Der Gesamtdatensatz ist als Parquet oder via DuckDB-Streaming verfügbar.

    Maschinenlesbar: catalog.json · DOI: 10.5281/zenodo.20439915

    Direktzugriff & Streaming

    Parquet-Dateien direkt aus der URL lesen — DuckDB überträgt per Byte-Range-Request nur die benötigten Daten.

    Für gefilterten oder programmatischen Export — fertige CSV-Dateien stehen im Bereich „Download nach Kreis" (oben) bereit.

    Datenvorschau

    Wähle einen Kreis und erkunde 10 Beispieldatensätze — eine Zeile je Person, mit allen Haushaltsattributen.

    AGS-Nummer eingeben oder Kreisnamen tippen und aus der Liste wählen.

    HaushaltPersonen
    AGSGebäudetypWohnfläche (m²)Haushaltseinkommen (€/Jahr)AltersgruppeGeschlechtBildung
    Keine Zeilen für diesen Kreis.
    Haushalte gesamt: 0
    Seite 1 / 1

    Datenschema

    Alle 45 Spalten in den Parquet-Dateien — ein Eintrag je Person, Haushaltsattribute werden innerhalb des Haushalts geteilt.

    Spalte Ebene Typ Beschreibung / Werte
    Identifikatoren
    household_idIDstringEindeutige Haushalt-ID
    person_idIDstringEindeutige Personen-ID
    person_rankIDintRang innerhalb des Haushalts (1 = Hauptperson)
    agsIDstringAGS-Kreisschlüssel (5-stellig, z.B. „11000" für Berlin)
    stateIDintBundesland-Code — 1–16
    region_typeIDintBKG-Siedlungstyp — 1=Kernstadt, 2=ländlicher Kreis, 3=ländlicher Raum
    original_household_idIDstringZeilenindex im GAN-generierten Donor-Pool (State-Region). Kein Bezug zu EVS-Umfrageteilnehmern.
    source_household_idIDstringIdentisch mit original_household_id (Donor-Pool-Index, beide Spalten sind immer gleich)
    Personenmerkmale
    genderPersonintGeschlecht — 1=männlich, 2=weiblich
    age_groupPersonintAltersgruppe — 0=0–5, 1=6–14, 2=15–17, 3=18–29, 4=30–44, 5=45–59, 6=60–74, 7=75+
    educationPersonintBildungsabschluss — 1=kein Abschluss, 2=Hauptschule, 3=Realschule, 4=Berufsausbildung, 5=Hochschule
    employmentPersonintErwerbsstatus — 1=erwerbslos, 2=Teilzeit, 3=Vollzeit, 4=Beamte/r, 5=Selbstständig
    Haushaltsmerkmale
    household_sizeHaushaltintAnzahl Personen im Haushalt
    household_typeHaushaltintHaushaltstyp — 1=Alleinstehend, 2=Paar, 3=Alleinerziehend, 4=Paar+Kinder, 5=Sonstiger
    household_type_27HaushaltintHaushaltstyp (5 Kategorien, identisch mit household_type nach Harmonisierung — Name ist historisches Artefakt des EVS-Rohvariablen)
    building_typeHaushaltintGebäudetyp — 1=Einfamilienhaus, 2=Doppelhaus, 3=Mehrfamilienhaus, 4=Sonstiges
    building_ownershipHaushaltintEigentümerschaft — 1=Eigentümer, 2=Mieter
    building_ageHaushaltintBaualtersklasse — 1=vor 1949, 2=1949–1978, 3=1979–2001, 4=nach 2001
    building_sizeHaushaltfloatWohnfläche in m²
    heating_typeHaushaltintHeizungsart — 1=Fernwärme, 2=Zentralheizung, 3=Einzelofen
    heating_energyHaushaltintPrimärer Energieträger — 0=keine, 1=Strom, 2=Gas, 3=Heizöl, 4=Festbrennstoffe, 5=Erneuerbare
    household_incomeHaushaltintEinkommensklasse (Destatis-Klassifikation, 10 Stufen) — 1 (niedrig) bis 10 (hoch)
    household_income_numHaushaltfloatJährliches Nettoeinkommen in €
    aeqHaushaltfloatÄquivalenzeinkommen (OECD-Skala) in €/Jahr
    exp_quotaHaushaltfloatKonsumquote — Verhältnis der Jahresausgaben zum Jahres-Nettoeinkommen des Haushalts
    Ausgaben (€/Jahr)
    expenditureHaushaltfloatGesamte Jahresausgaben des Haushalts in EUR (Summe aller Ausgabenkategorien nach Kalibrierung)
    exp_foodHaushaltfloatErnährung und alkoholfreie Getränke
    exp_clothesHaushaltfloatBekleidung und Schuhe
    exp_housing_totalHaushaltfloatWohnen gesamt
    exp_housing_rentHaushaltfloatMiete (Mieter) oder imputierter Mietwert (Eigentümer)
    exp_housing_electricityHaushaltfloatStrom
    exp_housing_heatingHaushaltfloatHeizkosten
    exp_housing_imputedHaushaltfloatImputierter Mietwert (nur Eigentümer)
    exp_housing_maintenanceHaushaltfloatInstandhaltung und Reparatur
    exp_transport_totalHaushaltfloatMobilität gesamt
    exp_transport_fuelHaushaltfloatKraftstoff
    exp_transport_ownHaushaltfloatFahrzeuganschaffung und Leasing
    exp_transport_publicHaushaltfloatÖffentlicher Nahverkehr
    exp_healthHaushaltfloatGesundheit
    exp_leisureHaushaltfloatFreizeit und Kultur
    exp_telecomHaushaltfloatTelekommunikation
    exp_furnitureHaushaltfloatEinrichtung und Hausrat
    exp_hospitalityHaushaltfloatGaststätten und Beherbergung
    exp_educationHaushaltfloatBildung
    exp_otherHaushaltfloatSonstige Ausgaben