Daten Repository
Allgemeine Formate im Repo
NDJSON und Parquet sind beides Datenformate, die sich gut ergänzen:
NDJSON (Newline Delimited JSON) speichert Ereignisse zeilenweise als JSON-Objekte.
→ Ideal für Streaming und APIs, weil jede Zeile ein eigenständiger Datensatz ist.
→ Lässt sich mit Tools wiejq
,pandas.read_json(lines=True)
oderjsonlite::stream_in()
direkt auswerten.Parquet ist ein spaltenorientiertes, binäres Format für große Datenmengen.
→ Optimiert für Analysen und Abfragen, sehr platzsparend und schnell.
→ Standard in Big-Data-Ecosystemen (Spark, Hadoop, DuckDB, BigQuery, GDAL/GeoParquet).
Typischer Workflow: Rohdaten zunächst als NDJSON persistieren → für Analyse/Archiv in Parquet konvertieren.
Sensoren
- DDS75-LB (
dds75-lb-*.parquet
):distance_cm
(bzw.Distance_mm
),temperature
,battery
, Flags (interrupt_flag
,sensor_flag
). - PS-LB (
burgwald-ps-lb-*.parquet
):water_cm
bzw.pressure_kpa/_mpa
, zusätzlichidc_input_ma
,vdc_input_v
,battery
, digitale Eingänge. - SenseCAP (
burgwald-sensecap-*.parquet
):temperature
,humidity
,pressure_hpa
,illumination
, ggf.uv_index
,wind_speed
,wind_dir
,rainfall
.
Dateien in data/
Lade Datenliste …