Ανίχνευση μεμονωμένων εγκαταλελειμμένων σπιτιών από την προβολή οδών Google: Μια ιεραρχική προσέγγιση βαθιάς μάθησης.

Από RemoteSensing Wiki

Έκδοση στις 18:26, 19 Μαρτίου 2024 υπό τον/την Evangelos Arletos (Συζήτηση | Συνεισφορές/Προσθήκες)
('διαφορά') ←Παλιότερη αναθεώρηση | εμφάνιση της τρέχουσας αναθεώρησης ('διαφορά') | Νεώτερη αναθεώρηση→ ('διαφορά')
Μετάβαση σε: πλοήγηση, αναζήτηση

Πρωτότυπος τίτλος: Detecting individual abandoned houses from google street view: A hierarchical deep learning approach

Συγγραφείς: Shengyuan Zou, Le Wang

1 Department of Geography, University at Buffalo, the State University of New York, Amherst, NY 14261, United States

Δημοσιεύθηκε: ISPRS Journal of Photogrammetry and Remote Sensing, 2021

Σύνδεσμος πρωτότυπου κειμένου: [[1]]

Λέξεις-κλειδιά: Εγκατάλειψη κατοικιών, θέαση δρόμου, Βαθιά μάθηση καθοδηγούμενη από τη γνώση, Ταξινόμηση που βασίζεται σε patch

Περίληψη

Οι εγκαταλελειμμένες κατοικίες (ΑΣ) αποτελούν σημαντικές προκλήσεις στις αστικές κοινότητες, επηρεάζοντας την τοπική ασφάλεια, τις αγορές κατοικίας και τα οικονομικά της κυβέρνησης. Οι παραδοσιακές πηγές δεδομένων για την ανίχνευση ΑΗ, όπως τα δεδομένα πεδίου, τα δεδομένα κοινής ωφέλειας και τα δεδομένα τηλεπισκόπησης, συχνά υπολείπονται στην παροχή δεδομένων λεπτής ανάλυσης σε μεγάλες χωρικές περιοχές με οικονομικά αποδοτικό τρόπο. Για την αντιμετώπιση αυτής της πρόκλησης, οι εικόνες του Google Street View (GSV) αναδεικνύονται ως πολύτιμη πηγή δεδομένων ανοικτής πρόσβασης με παγκόσμια κάλυψη. Ωστόσο, η ανίχνευση ΑΗ από εικόνες GSV απαιτεί μια αποτελεσματική μέθοδο για τη διάκριση των αυθεντικών οπτικών χαρακτηριστικών από τον περιττό θόρυβο. Η παρούσα μελέτη παρουσιάζει μια ιεραρχική μέθοδο βαθιάς μάθησης για την ανίχνευση ΑΗ σε ατομικό επίπεδο από εικόνες GSV. Η μέθοδος αξιοποιεί τόσο τα παγκόσμια όσο και τα τοπικά οπτικά χαρακτηριστικά της AH μέσω τριών βημάτων: (1) Η ταξινόμηση με βάση το σκηνικό εξάγει τα παγκόσμια οπτικά χαρακτηριστικά μέσω της τελειοποίησης ενός προ-εκπαιδευμένου μοντέλου βαθιάς συνελικτικής νευρωνικής δικτύωσης (CNN). (2) Η ταξινόμηση βάσει κηλίδων εντοπίζει συγκεκριμένα τοπικά χαρακτηριστικά χρησιμοποιώντας δύο βαθιά μοντέλα CNN για την ταξινόμηση επιφανειών φθαρμένων προσόψεων κτιρίων και κηλίδων υπερφυούς βλάστησης που παράγονται από εικόνες GSV. (3) Ανιχνεύονται ΑΗ σε ατομικό επίπεδο με την ενσωμάτωση των αποτελεσμάτων της ταξινόμησης σκηνής και της ταξινόμησης μπαλωμάτων σε ένα μοντέλο δέντρου απόφασης. Τα πειραματικά αποτελέσματα σε ένα σύνολο δεδομένων που συλλέχθηκαν από πέντε πόλεις της ζώνης σκουριάς καταδεικνύουν ένα F-score 0,84 για την ανίχνευση AH, αναδεικνύοντας την αποτελεσματικότητα της προτεινόμενης ιεραρχικής προσέγγισης βαθιάς μάθησης. Επιπλέον, η μέθοδος εφαρμόζεται για τη δημιουργία ενός χάρτη AH σε μια νέα τοποθεσία στο Detroit, MI, αποδεικνύοντας τη σκοπιμότητα και τη δυνατότητά της για την ανίχνευση AH σε μεγάλες χωρικές εκτάσεις. Η παρούσα μελέτη υπογραμμίζει τη σημασία των εικόνων GSV στην ανίχνευση ΑΗ και αναδεικνύει τις πολλά υποσχόμενες εφαρμογές της σε αστικές μελέτες και διαδικασίες λήψης αποφάσεων.

Εισαγωγή

Το άρθρο πραγματεύεται την επείγουσα ανάγκη ανίχνευσης εγκαταλελειμμένων σπιτιών σε ατομικό επίπεδο και την περιορισμένη εξερεύνηση στον τομέα αυτό. Οι υπάρχουσες μελέτες έχουν χρησιμοποιήσει τρεις κύριες πηγές δεδομένων - δεδομένα πεδίου, δεδομένα κοινής ωφέλειας και δεδομένα τηλεπισκόπησης πολύ υψηλής ανάλυσης (VHR) - για την πρόβλεψη της εγκατάλειψης κατοικιών σε ατομικό επίπεδο. Τα δεδομένα πεδίου περιλαμβάνουν συνήθως πληροφορίες για τη στέγαση που συλλέγονται μέσω ερευνών, ενώ τα δεδομένα κοινής ωφέλειας, όπως τα δεδομένα για τους κρουνούς, έχουν επίσης χρησιμοποιηθεί στη μοντελοποίηση της εγκατάλειψης. Ωστόσο, αυτές οι μέθοδοι αντιμετωπίζουν περιορισμούς όσον αφορά την προσβασιμότητα και την ποιότητα των δεδομένων σε διάφορες πόλεις.Για να ξεπεραστούν αυτοί οι περιορισμοί, ορισμένοι μελετητές έχουν στραφεί σε δεδομένα τηλεπισκόπησης VHR, τα οποία παρέχουν λεπτομερείς εικόνες φυσικών χαρακτηριστικών. Ωστόσο, τα παραδοσιακά δεδομένα τηλεπισκόπησης έχουν τις δικές τους αδυναμίες, καθώς προσφέρουν μόνο απόψεις από πάνω προς τα κάτω και περιορισμένες πληροφορίες σχετικά με τις στέγες και τη βλάστηση, καθιστώντας δύσκολη την αποτελεσματική διαφοροποίηση μεταξύ εγκαταλελειμμένων και κατειλημμένων σπιτιών. Ως εκ τούτου, υπάρχει ανάγκη για μια νέα πηγή δεδομένων που να είναι τόσο προσβάσιμη όσο και αποτελεσματική στον εντοπισμό εγκαταλελειμμένων σπιτιών.

Το άρθρο εξετάζει τις δυνατότητες των εικόνων του Google Street View (GSV) ως λύση για τον εντοπισμό εγκαταλελειμμένων σπιτιών (AH) και τις προκλήσεις που σχετίζονται με την ανάπτυξη μιας συμβατής μεθόδου για την εξαγωγή αυθεντικών οπτικών χαρακτηριστικών των AH από εικόνες GSV. Οι εικόνες GSV προσφέρουν μια ανθρωπομορφική προοπτική σε επίπεδο δρόμου, η οποία συνδυάζει την ευρεία κάλυψη των δεδομένων τηλεπισκόπησης με τις λεπτομερείς απόψεις των δεδομένων πεδίου. Αυτό την καθιστά πολύτιμη πηγή δεδομένων για αστικές μελέτες, συμπεριλαμβανομένης της ανίχνευσης ΑΗ. Ωστόσο, προκύπτει μια κρίσιμη πρόκληση στην ανάπτυξη μιας μεθόδου για την αποτελεσματική εξαγωγή σχετικών οπτικών χαρακτηριστικών της ΑΗ από εικόνες GSV, λαμβάνοντας υπόψη την υπερβολική πληροφορία που περιέχεται σε αυτές τις εικόνες. Οι υπάρχουσες μέθοδοι βαθιάς μάθησης για την εξαγωγή χαρακτηριστικών κτιρίων λειτουργούν σε δύο κλίμακες: με βάση τη σκηνή και με βάση τα μπαλώματα. Οι μέθοδοι που βασίζονται στη σκηνή εστιάζουν σε παγκόσμια χαρακτηριστικά που εξάγονται από ολόκληρη τη σκηνή θέασης δρόμου, ενώ οι μέθοδοι που βασίζονται σε μπαλώματα αναλύουν τοπικά χαρακτηριστικά που εξάγονται από ομοιογενή μπαλώματα εντός της σκηνής. Παρά τις προόδους τόσο στις μεθόδους που βασίζονται στη σκηνή όσο και στις μεθόδους που βασίζονται σε επιθέματα, δεν έχουν γίνει προσπάθειες προσαρμογής αυτών των μεθόδων για την ανίχνευση ΑΗ από εικόνες GSV. Προκαταρκτικά πειράματα έχουν δείξει ότι τόσο τα παγκόσμια όσο και τα τοπικά χαρακτηριστικά μπορούν να υποδείξουν την εγκατάλειψη κατοικιών σε εικόνες GSV, αλλά η ενσωμάτωση αυτών των χαρακτηριστικών με τη χρήση υφιστάμενων μεθόδων παραμένει άλυτη. Ως εκ τούτου, η μελέτη αποσκοπεί στην αντιμετώπιση δύο βασικών στόχων: πρώτον, στη διερεύνηση της σκοπιμότητας και της ακρίβειας της χρήσης εικόνων GSV για την ανίχνευση εγκαταλελειμμένων οικιστικών μονάδων σε ατομικό επίπεδο και, δεύτερον, στην ανάπτυξη μιας ιεραρχικής προσέγγισης βαθιάς μάθησης που ενσωματώνει παγκόσμια και τοπικά οπτικά χαρακτηριστικά για την αποτελεσματικότερη ανίχνευση ΑΗ.

Μέθοδος

Στην παρούσα μελέτη, αναπτύχθηκε μια νέα ιεραρχική μέθοδος ταξινόμησης βαθιάς μάθησης για την ανίχνευση εγκαταλελειμμένων σπιτιών (AH) από εικόνες Google Street View (GSV) (βλ. Εικ. 2). Η μεθοδολογία περιελάμβανε διάφορα βασικά βήματα, όπως περιγράφονται παρακάτω: Συλλογή και προεπεξεργασία δεδομένων: Οι εικόνες GSV συλλέχθηκαν και προεπεξεργάστηκαν για να προετοιμαστούν για την ταξινόμηση. Ταξινόμηση βάσει σκηνής (ενότητα 2.3): Χρησιμοποιήθηκε ένα προεκπαιδευμένο βαθύ μοντέλο συνεπτυγμένου νευρωνικού δικτύου (CNN) σε μια προσέγγιση μάθησης μεταφοράς για την εξαγωγή χαρακτηριστικών παγκόσμιου επιπέδου από ολόκληρη τη σκηνή προβολής δρόμου. Αυτό το βήμα αποσκοπούσε στη σύλληψη γενικών οπτικών ενδείξεων ενδεικτικών της ΑΗ. Ταξινόμηση με βάση τα σημεία (ενότητα 2.4): Δημιουργήθηκαν patches από τις εικόνες GSV και τα patches αυτά ταξινομήθηκαν εκ των προτέρων σε τρεις κατηγορίες: κτίριο, βλάστηση και άλλα. Δύο ξεχωριστά βαθιά μοντέλα CNN τελειοποιήθηκαν χρησιμοποιώντας τα μπαλώματα κτιρίων και βλάστησης για να αναγνωρίσουν ανεξάρτητα τα υποβαθμισμένα μπαλώματα κτιρίων και τα μπαλώματα βλάστησης. Αυτό το βήμα επικεντρώθηκε στην εξαγωγή χαρακτηριστικών σε τοπικό επίπεδο ειδικά για την AH. Ενσωμάτωση των αποτελεσμάτων ταξινόμησης βάσει σκηνής και βάσει μπαλωμάτων (ενότητα 2.5): Τα ποσοστά των αναγνωρισμένων μπαλωμάτων σε όλα τα μπαλώματα χρησιμοποιήθηκαν ως χαρακτηριστικά τοπικού επιπέδου. Αυτά τα χαρακτηριστικά ενσωματώθηκαν στη συνέχεια με τα αποτελέσματα της ταξινόμησης βάσει σκηνής με τη χρήση ενός μοντέλου δέντρων απόφασης. Το δέντρο απόφασης έβγαλε την κατάσταση εγκατάλειψης κατοικιών σε ατομικό επίπεδο, καθορίζοντας αν το σπίτι εντός της εικόνας GSV ήταν ΑΗ ή όχι. Η λεπτομερής μεθοδολογία παρουσιάστηκε στις ενότητες που καλύπτουν τη συλλογή εικόνων, την προεπεξεργασία εικόνων, την ταξινόμηση βάσει σκηνής, την ταξινόμηση βάσει κηλίδων και την ενσωμάτωση των αποτελεσμάτων της ταξινόμησης βάσει σκηνής και κηλίδων στην ανίχνευση εγκαταλελειμμένων σπιτιών. Αυτή η ολοκληρωμένη προσέγγιση αποσκοπούσε στην αξιοποίηση τόσο των παγκόσμιων όσο και των τοπικών οπτικών χαρακτηριστικών που εξάγονται από τις εικόνες GSV για τη βελτίωση της ακρίβειας της ανίχνευσης ΑΗ.

Στην παρούσα μελέτη χρησιμοποιήθηκαν δύο σύνολα δεδομένων εικόνων:

Rust-Belt Dataset: Αυτό το σύνολο δεδομένων καλύπτει πέντε πόλεις των ΗΠΑ που βρίσκονται στην περιοχή Rust Belt: Cleveland, OH- Chicago, IL- Pittsburgh, PA- Detroit, MI- και Binghamton, NY (όπως απεικονίζεται στο Σχήμα 3). Η περιοχή Rust Belt έχει βιώσει σημαντική αποβιομηχάνιση και ερήμωση από τα μέσα του 20ου αιώνα, με αποτέλεσμα τη συγκέντρωση εγκαταλελειμμένων κατοικιών (ΑΗ). Για παράδειγμα, στο Ντιτρόιτ, ο πληθυσμός μειώθηκε κατά περισσότερο από το ήμισυ από το 1950 έως το 2015, ενώ πάνω από το ένα τρίτο των ακινήτων (139.699 από τα 384.672) αντιμετωπίζουν κατάσχεση λόγω αθέτησης υποθηκών ή απλήρωτων φόρων. Το σύνολο δεδομένων περιλαμβάνει ΑΗ που βρίσκονται σε μεταβατικό στάδιο, όπως προκύπτει από τα σημαντικά προγράμματα κατεδάφισης που εφαρμόστηκαν σε αυτές τις πόλεις. Για παράδειγμα, μόνο η πόλη του Ντιτρόιτ κατεδάφισε περισσότερα από 20.000 σπίτια μέχρι το έτος 2020. Δοκιμαστικό σύνολο δεδομένων Ντιτρόιτ: Αυτό το πρόσθετο σύνολο δεδομένων επικεντρώνεται σε μια ξεχωριστή περιοχή μελέτης που βρίσκεται σε μια προαστιακή περιοχή εντός του Ντιτρόιτ, MI, χωρίς καμία επικάλυψη με το σύνολο δεδομένων Rust-Belt. Η περιοχή μελέτης περιλαμβάνει 340 αγροτεμάχια που βρίσκονται σε μια προαστιακή περιοχή με υπερ-κενό, όπως περιγράφεται στο Σχήμα 7. Αυτό το σύνολο δεδομένων χρησιμεύει για την αξιολόγηση της αποτελεσματικότητας της προτεινόμενης μεθόδου και την επίδειξη της εφαρμογής της σε ένα διαφορετικό γεωγραφικό περιβάλλον. Η χρήση αυτών των συνόλων δεδομένων επιτρέπει μια ολοκληρωμένη αξιολόγηση της αποτελεσματικότητας της ανίχνευσης της ΑΗ σε διαφορετικά αστικά περιβάλλοντα, που κυμαίνονται από μεγάλες πόλεις στην περιοχή Rust Belt μέχρι συγκεκριμένες προαστιακές περιοχές εντός του Ντιτρόιτ, MI.

Συλλέχθησαν ακατέργαστες εικόνες ανακτώντας και κατεβάζοντας εικόνες από το σύνολο δεδομένων GSV ανοικτής πρόσβασης. Δύο σύνολα δεδομένων οικιστικών διευθύνσεων λειτούργησαν ως είσοδος για τη συλλογή πιθανών εικόνων AH και OH, αντίστοιχα. Οι εγκαταλελειμμένες διευθύνσεις μονοκατοικιών ελήφθησαν από μια εμπορική εταιρεία δεδομένων με την ονομασία Vacant House Data Feed(https://realestatewealthnetwork.com/vacant-house-data-feed/). Αντίθετα, οι κατοικημένες διευθύνσεις μονοκατοικιών ελήφθησαν από το σύνολο δεδομένων OpenAddresses(https://openaddresses.io/), αφού αφαιρέθηκαν οι διευθύνσεις που επικαλύπτονται με το Vacant House Data Feed. Συγκεκριμένα, πρέπει να σημειωθεί ότι το Vacant House Data Feed είναι ένα εμπορικό σύνολο δεδομένων που συλλέγει διευθύνσεις κενών κατοικιών για διαχειριστές κατοικιών, το οποίο περιλαμβάνει όχι μόνο σπίτια που είναι εγκαταλελειμμένα αλλά και σπίτια που είναι προσωρινά κενά και προς πώληση. Ως εκ τούτου, τα σπίτια στο σύνολο δεδομένων που περιλαμβάνουν μεγάλο αριθμό καλά συντηρημένων σπιτιών προς πώληση είναι πέρα από τον ορισμό των εγκαταλελειμμένων σπιτιών, καθιστώντας απαραίτητη τη χειροκίνητη επισήμανση με οπτική ανάλυση για τον προσδιορισμό αξιόπιστων ετικετών βασικής αλήθειας. Οι εικόνες του Google Street View για τις AH και OH ανακτήθηκαν με βάση τις παραπάνω επιλεγμένες διευθύνσεις μέσω του GSV Static API. Για κάθε διεύθυνση σπιτιού στα σύνολα δεδομένων διευθύνσεων, το API επέστρεψε τη φωτογραφία που ελήφθη στην πλησιέστερη θέση λήψης εικόνας που βρίσκεται απέναντι από τη διεύθυνση-στόχο. Το μέγιστο οπτικό πεδίο ορίστηκε ως 120 μοίρες και ο βαθμός της κάθετης γωνίας της κάμερας ήταν 0. Το μέγεθος εξόδου της εικόνας σε pixels ήταν 640 × 640. Υπήρχαν 18.964 εικόνες GSV που συλλέχθηκαν ως ακατέργαστα δεδομένα με βάση διευθύνσεις από τα σύνολα δεδομένων Vacant House Data Feed και OpenAddresses. Συνολικά 7.580 (40%) των ακατέργαστων εικόνων διατηρήθηκαν μετά την προεπεξεργασία. Μεταξύ των 7.580 εικόνων, επιλέξαμε 2.011 εικόνες, συμπεριλαμβανομένων 1.007 εικόνων AH και 1.004 εικόνων OH για περαιτέρω επεξεργασιας (Πίνακας 1). Στη νέα τοποθεσία δοκιμής στο Detroit, MI, 136 από τα 340 αγροτεμάχια είχαν κατοικίες και ήταν διαθέσιμα για την ανίχνευση AH.

Λόγω της ανεξέλεγκτης ποιότητας των εικόνων street view, πολλές ακατέργαστες εικόνες GSV δεν μπορούν να χρησιμοποιηθούν στην ανίχνευση και πρέπει να αφαιρεθούν. Οι εικόνες αυτές παρουσιάζουν τα ακόλουθα προβλήματα (βλ. Εικ. 4): (1) Απόκρυψη. Το κτίριο-στόχος εμποδίζεται από άλλα αντικείμενα, όπως δέντρα και οχήματα, και έτσι δεν μπορεί να εμφανιστεί στην εικόνα. (2) Εσφαλμένη καταχώριση. Κατά τη λήψη εικόνων GSV, η κάμερα έχει πιθανώς μια απομακρυσμένη μετατόπιση με το σπίτι-στόχο, με αποτέλεσμα η εικόνα που λαμβάνεται να μην περιέχει μια πλήρη οικιστική ιδιοκτησία. Απαραίτητη προϋπόθεση για την ανίχνευση εγκατάλειψης κατοικιών είναι η εικόνα GSV να περιέχει μια σαφή και πλήρη οικιστική ιδιοκτησία στο κεντρικό της τμήμα. Είτε η απόκρυψη είτε η λανθασμένη καταχώριση μπορεί να επηρεάσει σοβαρά τα αποτελέσματα της ανίχνευσης. Έτσι, αναπτύξαμε έναν αγωγό επεξεργασίας εικόνας για την αφαίρεση αυτών των ακραίων στοιχείων.

Κατά τη διαδικασία ανίχνευσης και αφαίρεσης των ακραίων τιμών από τις εικόνες του Google Street View (GSV) για την ανίχνευση εγκαταλελειμμένων σπιτιών, υιοθετήσαμε μια εκλεπτυσμένη προσέγγιση για τη βελτίωση της ποιότητας του συνόλου δεδομένων. Αρχικά, επικεντρωθήκαμε στα κεντρικά εικονοστοιχεία 320 × 320 των εικόνων GSV 640 × 640 εικονοστοιχείων, στρέφοντας την προσοχή στην κεντρική περιοχή που περιέχει το κτίριο-στόχο. Αξιοποιώντας μια προηγουμένως καθιερωμένη μεθοδολογία (Kang et al., 2018), χρησιμοποιήσαμε το μοντέλο VGG16 deep convolutional neural network (CNN) που εκπαιδεύτηκε στο σύνολο δεδομένων Places365 (Simonyan and Zisserman, 2014; Zhou et al., 2017) για την αναγνώριση σκηνών. Χρησιμοποιώντας το σύστημα ταξινόμησης στο Places365, επιλέξαμε εννέα κλάσεις-στόχους που σχετίζονται με οικιστικές δομές. Μόνο οι περικομμένες εικόνες που ανήκαν σε αυτές τις κλάσεις-στόχους διατηρήθηκαν για περαιτέρω ανάλυση. Ως αποτέλεσμα, 7.580 (40%) ακατέργαστες εικόνες GSV διατηρήθηκαν, ενώ 11.384 (60%) φιλτράρονταν. Στη συνέχεια, μέσω οπτικής ερμηνείας, επιλέξαμε 1.007 εγκαταλελειμμένα σπίτια και 1.004 κατοικημένα σπίτια από τις διατηρημένες εικόνες, εξασφαλίζοντας την καθαρότητα του συνόλου εκπαίδευσης. Αυτή η σχολαστική διαδικασία βελτίωσης είχε ως στόχο να ενισχύσει την αξιοπιστία και την ακρίβεια των μετέπειτα προσπαθειών εντοπισμού εγκαταλελειμμένων σπιτιών με τη χρήση εικόνων GSV.

Σε αυτή την ενότητα, παρουσιάζουμε την εφαρμογή μιας προσέγγισης μάθησης μεταφοράς για ταξινόμηση βάσει σκηνής για την εξαγωγή παγκόσμιων χαρακτηριστικών από εικόνες του Google Street View (GSV). Χρησιμοποιώντας τις εικόνες GSV που διατηρήθηκαν στην προηγούμενη ενότητα, η κατάσταση εγκατάλειψης κατοικιών κάθε εικόνας επισημάνθηκε χειροκίνητα μέσω οπτικής ερμηνείας. Το σύνολο δεδομένων χωρίστηκε τυχαία σε σύνολα εκπαίδευσης (50%), επικύρωσης (10%) και δοκιμής (40%). Υιοθετήσαμε μια στρατηγική εκμάθησης μεταφοράς για την τελειοποίηση ενός προ-εκπαιδευμένου μοντέλου συνελικτικού νευρωνικού δικτύου (CNN), συγκεκριμένα του μοντέλου VGG16 που προ-εκπαιδεύτηκε στο σύνολο δεδομένων Places365. Πριν από την εκμάθηση, οι εικόνες άλλαξαν μέγεθος ώστε να ταιριάζουν στις απαιτήσεις εισόδου του μοντέλου CNN. Η έξοδος αυτής της δυαδικής ταξινόμησης ήταν τόσο η προβλεπόμενη κατηγορία όσο και η πιθανότητα η σκηνή να ανήκει σε δύο κατηγορίες, με την πιθανότητα να ανήκει στην κατηγορία εγκαταλελειμμένο σπίτι (AH) να χρησιμοποιείται ως αποτέλεσμα ταξινόμησης με βάση τη σκηνή στο επακόλουθο μοντέλο δέντρου αποφάσεων. Η διαδικασία εκμάθησης εκτελέστηκε με τη χρήση του Caffe σε μια πλατφόρμα Linux Ubuntu 16.04, με τη χρήση μιας GPU NVIDIA GTX 1080 Ti, επιταχυνόμενη από το cuDNN5. Η εκπαίδευση πραγματοποιήθηκε σε 50 εποχές με μέγεθος παρτίδας 10, ρυθμό μάθησης 1 * 10^-3, ορμή 0,9 και μείωση του ρυθμού μάθησης κατά 0,1 κάθε 10 εποχές. Για την εκπαίδευση χρησιμοποιήθηκε απώλεια διασταυρούμενης εντροπίας, η οποία συμπληρώθηκε από μια παράμετρο αποσύνθεσης βάρους 5 * 10^-4. Αυτή η μεθοδολογία επέτρεψε την εξαγωγή παγκόσμιων χαρακτηριστικών που είναι ζωτικής σημασίας για τον εντοπισμό εγκαταλελειμμένων σπιτιών από εικόνες GSV, συμβάλλοντας στην επακόλουθη ανάπτυξη ενός ολοκληρωμένου μοντέλου δέντρου απόφασης για την ανίχνευση εγκαταλελειμμένων σπιτιών.

Η παρούσα μελέτη παρουσιάζει μια μέθοδο ταξινόμησης με βάση τη σκηνή που αποσκοπεί στον εντοπισμό εγκαταλελειμμένων σπιτιών από εικόνες του Google Street View (GSV). Μέσω χειροκίνητης οπτικής ερμηνείας, οι εικόνες GSV επισημάνθηκαν με την κατάσταση εγκατάλειψης κατοικιών και χωρίστηκαν σε σύνολα εκπαίδευσης, επικύρωσης και δοκιμής. Αξιοποιώντας τη μάθηση μεταφοράς, ένα προ-εκπαιδευμένο μοντέλο συνελικτικού νευρωνικού δικτύου (CNN), το VGG16, προ-εκπαιδευμένο στο σύνολο δεδομένων Places365, συντονίστηκε λεπτομερώς για την εξαγωγή συνολικών χαρακτηριστικών από τις εικόνες GSV. Η έξοδος αυτής της δυαδικής ταξινόμησης παρείχε τόσο την προβλεπόμενη κατηγορία όσο και την πιθανότητα η σκηνή να ανήκει στην κατηγορία των εγκαταλελειμμένων σπιτιών. Η διαδικασία εκμάθησης, η οποία διεξήχθη με τη χρήση του Caffe σε μια πλατφόρμα Linux Ubuntu 16.04 με μια GPU NVIDIA GTX 1080 Ti, περιελάμβανε εκπαίδευση σε 50 εποχές με συγκεκριμένες παραμέτρους βελτιστοποιημένες για ακρίβεια. Αυτή η μεθοδολογία διευκόλυνε την εξαγωγή βασικών χαρακτηριστικών για την αναγνώριση εγκαταλελειμμένων σπιτιών, συμβάλλοντας στην ανάπτυξη ενός ισχυρού μοντέλου δέντρων απόφασης για την αξιολόγηση της αστικής παρακμής και τις προσπάθειες αναζωογόνησης. Η αστική παρακμή που προκύπτει από την εγκατάλειψη κατοικιών αποτελεί σημαντική πρόκληση για τις πόλεις παγκοσμίως. Η αντιμετώπιση του ζητήματος αυτού απαιτεί αποτελεσματικές μεθόδους για τον εντοπισμό εγκαταλελειμμένων κατοικιών, οι οποίες είναι απαραίτητες για τον αστικό σχεδιασμό και τις προσπάθειες αναζωογόνησης. Στην παρούσα μελέτη, προτείνουμε μια νέα προσέγγιση που αξιοποιεί εικόνες του Google Street View (GSV) και προηγμένες τεχνικές βαθιάς μάθησης για την αυτοματοποιημένη ανίχνευση εγκαταλελειμμένων σπιτιών. Η μεθοδολογία μας περιλαμβάνει δύο βασικά στοιχεία: ταξινόμηση με βάση τη σκηνή και ταξινόμηση με βάση τα μπαλώματα. Στην ταξινόμηση με βάση τη σκηνή, χρησιμοποιούμε μάθηση μεταφοράς με ένα προ-εκπαιδευμένο μοντέλο VGG16 CNN για την εξαγωγή σφαιρικών χαρακτηριστικών από εικόνες GSV. Αυτά τα χαρακτηριστικά χρησιμοποιούνται για την πρόβλεψη της πιθανότητας εγκατάλειψης κατοικιών σε επίπεδο σκηνής. Εν τω μεταξύ, η ταξινόμηση με βάση τα μπαλώματα επικεντρώνεται στην εξαγωγή τοπικών χαρακτηριστικών χρησιμοποιώντας τον αλγόριθμο Pyramid Histogram of Visual Words (PHOW). Χρησιμοποιούμε την ομαδοποίηση και την ταξινόμηση με βαθιά μάθηση για να εντοπίσουμε τα επιδιορθωμένα μπαλώματα κτιρίων και τα μπαλώματα βλάστησης που έχουν αναπτυχθεί υπερβολικά μέσα σε εικόνες GSV. Η ενσωμάτωση των αποτελεσμάτων της ταξινόμησης με βάση τη σκηνή και την περιοχή επιτυγχάνεται μέσω ενός μοντέλου δέντρων απόφασης. Αυτό το μοντέλο συνδυάζει χαρακτηριστικά σε παγκόσμιο επίπεδο από την ταξινόμηση βάσει σκηνής με χαρακτηριστικά σε τοπικό επίπεδο από την ταξινόμηση βάσει κηλίδων για την πρόβλεψη της εγκατάλειψης κατοικιών σε ατομικό επίπεδο. Λαμβάνοντας υπόψη τόσο μακροσκοπικά όσο και μικροσκοπικά οπτικά στοιχεία, η προσέγγισή μας προσφέρει μια ολοκληρωμένη λύση για τον ακριβή εντοπισμό εγκαταλελειμμένων κατοικιών. Επικυρώνουμε τη μεθοδολογία μας χρησιμοποιώντας σύνολα δεδομένων που συλλέχθηκαν από πολλές πόλεις των ΗΠΑ, όπως το Κλίβελαντ, το Σικάγο, το Πίτσμπουργκ, το Ντιτρόιτ και το Μπίνγκαμτον, καθώς και μια τοποθεσία δοκιμής στα προάστια του Ντιτρόιτ. Τα αποτελέσματά μας καταδεικνύουν την αποτελεσματικότητα της προτεινόμενης προσέγγισης στον εντοπισμό εγκαταλελειμμένων σπιτιών, παρέχοντας έτσι πολύτιμες πληροφορίες για τους πολεοδόμους και τους υπεύθυνους χάραξης πολιτικής για την καταπολέμηση της αστικής παρακμής και την αναζωογόνηση των προβληματικών γειτονιών.

Google Street View

Η ανίχνευση εγκαταλελειμμένων κατοικιών αποτελεί σημαντική πρόκληση για τις αστικές μελέτες, με επιπτώσεις στην αναζωογόνηση των γειτονιών και τη διαχείριση των πόλεων. Οι παραδοσιακές μέθοδοι που βασίζονται σε έρευνες πεδίου ή δεδομένα τηλεπισκόπησης έχουν περιορισμούς όσον αφορά την ακρίβεια, το κόστος ή την προσβασιμότητα. Στην παρούσα μελέτη, διερευνούμε την αποτελεσματικότητα των εικόνων του Google Street View (GSV) ως αυτόνομη πηγή δεδομένων για την ανίχνευση ΑΗ. Αναπτύξαμε μια ιεραρχική μέθοδο ταξινόμησης βαθιάς μάθησης για την εξαγωγή τόσο παγκόσμιων όσο και τοπικών χαρακτηριστικών από εικόνες GSV. Η ταξινόμηση με βάση το σκηνικό χρησιμοποίησε μια προσέγγιση μάθησης μεταφοράς με ένα προ-εκπαιδευμένο μοντέλο VGG16 για την εξαγωγή παγκόσμιων χαρακτηριστικών, ενώ η ταξινόμηση με βάση το patch χρησιμοποίησε χαρακτηριστικά πυραμίδας ιστογράμματος οπτικών λέξεων (PHOW) και μοντέλα CNN για την εξαγωγή τοπικών χαρακτηριστικών. Η ενσωμάτωση αυτών των χαρακτηριστικών με τη χρήση ενός μοντέλου δέντρων απόφασης επέτρεψε την ανίχνευση ΑΗ σε ατομικό επίπεδο.Τα πειράματα που πραγματοποιήθηκαν σε ένα σύνολο δεδομένων που καλύπτει πέντε πόλεις των ΗΠΑ στην περιοχή Rust Belt κατέδειξαν την αποτελεσματικότητα των εικόνων GSV στην ανίχνευση ΑΗ, επιτυγχάνοντας συνολική ακρίβεια 85% και βαθμολογία F 0,84. Οι δοκιμές σε μια νέα περιοχή μελέτης στο Ντιτρόιτ, MI, απέδωσαν συνολική ακρίβεια 78,7% και βαθμολογία F 0,74. Τα αποτελέσματα αυτά συγκρίνονται ευνοϊκά με προηγούμενες μελέτες που χρησιμοποιούν πολλαπλές πηγές δεδομένων για την ανίχνευση ΑΗ. Τα ευρήματά μας υποδηλώνουν ότι οι εικόνες GSV προσφέρουν μια οικονομικά αποδοτική και προσιτή λύση για την ανίχνευση ΑΗ, συμπληρώνοντας τις υπάρχουσες μεθόδους και διευκολύνοντας τις προσπάθειες αστικού σχεδιασμού και διαχείρισης. Ως σύνολο δεδομένων ανοικτής πρόσβασης με εκτεταμένη κάλυψη, οι εικόνες GSV υπόσχονται να αποτελέσουν ένα πολύτιμο εργαλείο για την αντιμετώπιση της αστικής παρακμής και την αναζωογόνηση των προβληματικών γειτονιών. Η ανίχνευση εγκαταλελειμμένων σπιτιών (ΑΣ) με τη χρήση εικόνων του Google Street View (GSV) προσφέρει σημαντικά πλεονεκτήματα, αλλά αντιμετωπίζει επίσης αρκετούς περιορισμούς. Το GSV παρέχει πολύτιμες πληροφορίες σε επίπεδο δρόμου για τον εντοπισμό της εγκατάλειψης κατοικιών, όπως αποδεικνύεται από τα πειράματα της μελέτης που επιτυγχάνουν συνολική ακρίβεια 85% και F-score 0,84 μόνο με τη χρήση εικόνων GSV. Παρά αυτά τα πολλά υποσχόμενα αποτελέσματα, εξακολουθούν να υπάρχουν προκλήσεις, ιδίως όσον αφορά την παρουσία παρακείμενων κτιρίων και την απόκρυψη στις εικόνες GSV. Τα γειτονικά κτίρια μπορούν να επηρεάσουν την ακρίβεια ανίχνευσης, οδηγώντας σε ψευδώς θετικά αποτελέσματα όταν τα κοντινά σπίτια είναι εγκαταλελειμμένα. Ομοίως, η απόκρυψη από δέντρα ή οχήματα μπορεί να αποκρύψει τις κατοικίες, επηρεάζοντας την αξιοπιστία της ανίχνευσης. Λύσεις όπως ο ακριβής εντοπισμός των κτιρίων-στόχων και η αξιοποίηση πολυχρονικών εικόνων GSV μπορούν να μετριάσουν αυτά τα ζητήματα. Επιπλέον, η ιεραρχική προσέγγιση, και ιδιαίτερα η μέθοδος με βάση τα μπαλώματα, έχει περιορισμούς που σχετίζονται με την απαιτητική σε εργασία επισήμανση των μπαλωμάτων και την εξάρτηση των παραμέτρων. Η αντιμετώπιση αυτών των προκλήσεων απαιτεί την τελειοποίηση των μεθόδων για την ακριβή εξαγωγή χαρακτηριστικών και τη βελτιστοποίηση των παραμέτρων για βελτιωμένη ακρίβεια ταξινόμησης. Οι μελλοντικές ερευνητικές κατευθύνσεις μπορεί να περιλαμβάνουν τη διερεύνηση μεθόδων σημασιολογικής τμηματοποίησης, την ενσωμάτωση πρόσθετων πηγών δεδομένων και την εφαρμογή των αποτελεσμάτων ανίχνευσης AH σε μελέτες αστικών περιοχών με λεπτή ανάλυση. Συνολικά, ενώ οι εικόνες GSV προσφέρουν πολύτιμες γνώσεις για την ανίχνευση ΑΗ, η αντιμετώπιση των περιορισμών τους είναι ζωτικής σημασίας για την αξιοποίηση του πλήρους δυναμικού τους στις αστικές μελέτες και στις διαδικασίες λήψης αποφάσεων.

Επίλογος

Σε αντίθεση με τα παραδοσιακά δεδομένα τηλεπισκόπησης, οι εικόνες προβολής δρόμου παρέχουν εντελώς νέες πληροφορίες για τη δομή της πρόσοψης του κτιρίου και την κατάσταση της βλάστησης στον προαύλιο χώρο, οι οποίες είναι απαραίτητες για την ανίχνευση ΑΗ. Στην παρούσα εργασία, αποδείξαμε την αποτελεσματικότητα των εικόνων GSV στην ανίχνευση ΑΗ σε ατομικό επίπεδο και προτείναμε την πρώτη προσέγγιση βαθιάς μάθησης για την ανίχνευση. Η νέα πηγή δεδομένων και η νέα ιεραρχική προσέγγιση βαθιάς μάθησης δίνουν τη δυνατότητα στο μοντέλο που αναπτύχθηκε να επιτύχει σημαντική ακρίβεια. Συγκεκριμένα, οι εικόνες GSV, ως νέα πηγή δεδομένων, είναι εξαιρετικές ως προς την αποτελεσματικότητα και την προσβασιμότητα στην ανίχνευση AH και απέδωσαν με συνέπεια σε όλη την περιοχή Rust Belt. Επίσης, η προτεινόμενη ιεραρχική βαθιά προσέγγιση CNN που μπορεί να ενσωματώσει παγκόσμια και τοπικά χαρακτηριστικά έχει μεγάλες δυνατότητες στην επίγεια επεξεργασία εικόνων σε αστικές μελέτες. Όσον αφορά τα πλεονεκτήματα και τους περιορισμούς στα δεδομένα και τη μέθοδο, η γενίκευση της προτεινόμενης μεθόδου σε μια μεγάλη περιοχή είναι συγκρατημένα αισιόδοξη. Τα αποτελέσματα της ανίχνευσης θα βοηθήσουν την πρωτοβουλία "Έξυπνη πόλη" συμβάλλοντας στην καλύτερη κατανόηση του αστικού περιβάλλοντος και φέρνοντας τη νέα ευκαιρία σε αστικές μελέτες υψηλής ανάλυσης, στη διαχείριση κατοικιών και στον αστικό σχεδιασμό.

Προσωπικά εργαλεία