Dokumenttyp: Konferenzbeitrag
Titel: Domain-Adaptive Object Detection for Enriching Semantic 3D City Models with Building Storeys from Street-View Images
Übersetzter Titel: Domänenadaptive Objekterkennung zur Anreicherung semantischer 3D-Stadtmodelle mit Gebäudegeschossen aus Straßenansichtsbildern
Autor*in: Arzoumanidis, Lukas 
As Samee, Al Maimun
Kanna, Elmehdi 
Nguyen, Son 
Dehbi, Youness 
Quellenangabe: 47th Canadian Symposium on Remote Sensing, 4-11 July 2026, Toronto, Canada 'From Imagery to Understanding' (ByA2: ISPRS Best Young Author Award Papers)
Erscheinungsdatum: Jul-2026
Freie Schlagwörter: domain-adaptive learning; building storey estimation; object detection; semantic enrichment; 3D city models; CityGML; domänenadaptives Lernen; Schätzung der Geschossanzahl; Objekterkennung; semantische Anreicherung; 3D-Stadtmodelle; ISPRS Best Young Author Award Papers
Genormte Schlagwörter: Dreidimensionales ModellGND
Geschoss <Bauwesen>GND
StadtplanungGND
Semantische ModellierungGND
Zusammenfassung: 
Semantically rich 3D city models play a vital role in a variety of applications, such as urban planning. Enhancing these models with currently unavailable attributes, such as building storey numbers, can unlock new opportunities to address pressing challenges, including sustainable urban development. In this work, we present an end-to-end pipeline for the automatic estimation of the number of storeys to semantically enrich 3D city models. We employ volunteered geographic information street-view imagery from Mapillary, using a COCO-pretrained object detection model to identify windows in façade images as key visual indicators for inferring building storey counts. Our detection pipeline, based on the YOLOv3 architecture, estimates storey numbers using an ensemble of clustering methods including Gaussian Mixtures and DBSCAN and enables the automatic augmentation of CityGML-based 3D city models by filling in missing attributes. This enrichment supports advanced applications, such as assessing building-scale energy demand, evaluating vertical urban growth patterns or population density estimations. We validated the feasibility of our approach with unfiltered Mapillary and applied it to a district in the city of Heidelberg, Germany. The paper also includes a detailed discussion of learning process quality, integration workflows, and visualization of the enriched 3D city model. The developed code is available at: https://github.com/hcu-cml/citydb-buildingstoreys-ai.

Semantisch angereicherte 3D-Stadtmodelle spielen eine wichtige Rolle in zahlreichen Anwendungsbereichen, beispielsweise in der Stadtplanung. Die Erweiterung dieser Modelle um bislang fehlende Attribute, wie etwa die Anzahl der Gebäudegeschosse, eröffnet neue Möglichkeiten zur Bewältigung drängender Herausforderungen, darunter die nachhaltige Stadtentwicklung. In dieser Arbeit präsentieren wir eine End-to-End-Pipeline zur automatischen Schätzung der Geschossanzahl, um 3D-Stadtmodelle semantisch anzureichern. Hierfür nutzen wir freiwillig bereitgestellte geografische Straßenansichten von Mapillary sowie ein auf COCO vortrainiertes Modell zur Objekterkennung, um Fenster in Fassadenbildern als zentrale visuelle Indikatoren zur Ableitung der Geschossanzahl zu identifizieren. Unsere auf der YOLOv3-Architektur basierende Detektionspipeline schätzt die Anzahl der Geschosse mithilfe eines Ensembles aus Clustering-Methoden, darunter Gaussian Mixtures und DBSCAN, und ermöglicht die automatische Erweiterung von auf CityGML basierenden 3D-Stadtmodellen durch das Ergänzen fehlender Attribute. Diese Anreicherung unterstützt weiterführende Anwendungen, etwa die Bewertung des gebäudebezogenen Energiebedarfs, die Analyse vertikaler Stadtwachstumsmuster oder die Abschätzung der Bevölkerungsdichte. Wir validierten die Umsetzbarkeit unseres Ansatzes anhand ungefilterter Daten von Mapillary und wendeten ihn auf einen Stadtbezirk in Heidelberg an. Darüber hinaus enthält die Arbeit eine detaillierte Diskussion der Qualität des Lernprozesses, der Integrationsworkflows sowie der Visualisierung des angereicherten 3D-Stadtmodells. Der entwickelte Quellcode ist verfügbar unter: https://github.com/hcu-cml/citydb-buildingstoreys-ai.
Sachgruppe (DDC): 004: Informatik
HCU-Fachgebiet / Studiengang: Computational Methods 
Verlag: Copernicus Publications
Teil der Schriftenreihe: ISPRS Annals of the Photogrammetry, Remote Sensing and Spatial Information Sciences 
Verlagslink (URL): https://www.isprs2026toronto.com/preliminary-program
https://www.isprs.org/publications/annals.aspx
URN (Zitierlink): urn:nbn:de:gbv:1373-repos-16400
Direktlink: https://repos.hcu-hamburg.de/handle/hcu/1248
Projekt: This research was partially supported by the project ‘Next Generation City Networking’ (Grant No. 19DZ24004) at the Hanseatic Wireless Innovation Competence Center (HAWICC), funded by the Federal Ministry of Transport via the German Center for Future Mobility (DZM)
Sponsor / Fördernde Einrichtung: Bundesministerium für Verkehr
Sprache: Englisch
Creative-Commons-Lizenz: https://creativecommons.org/licenses/by/4.0/
Enthalten in der SammlungPublikationen (mit Volltext)

Dateien zu dieser Ressource:
Internformat

Google ScholarTM

Prüfe

Export

Diese Ressource wurde unter folgender Copyright-Bestimmung veröffentlicht: Lizenz von Creative Commons Creative Commons