Ανίχνευση Παράνομων Κατασκευών στην Τηλεπισκόπηση - Εικόνες βασισμένες σε σημασιολογική κατάτμηση πολλαπλών κλιμάκων

Από RemoteSensing Wiki

(Διαφορές μεταξύ αναθεωρήσεων)
Μετάβαση σε: πλοήγηση, αναζήτηση
 
Γραμμή 1: Γραμμή 1:
-
[[Εικόνα:Tsalmasd_eikona_3.1.png|thumb|right|Εικόνα 1: Δομή πολυ-επίπεδης κατάτμησης]]
+
[[Εικόνα:Tsalmasd_eikona_3.1.png|thumb|right|'''Εικόνα 1:''' Δομή πολυ-επίπεδης κατάτμησης]]
-
[[Εικόνα:Tsalmasd_eikona_3.2.png|thumb|right|Εικόνα 2: Πίνακας αποτελεσμάτων ακρίβειας κατάτμησης]]
+
[[Εικόνα:Tsalmasd_eikona_3.2.png|thumb|right|'''Εικόνα 2:''' Πίνακας αποτελεσμάτων ακρίβειας κατάτμησης]]
-
[[Εικόνα:Tsalmasd_eikona_3.3.png|thumb|right|Εικόνα 3: Σύγκριση αποτελεσμάτων κατάτμησης]]
+
[[Εικόνα:Tsalmasd_eikona_3.3.png|thumb|right|'''Εικόνα 3:''' Σύγκριση αποτελεσμάτων κατάτμησης]]
-
[[Εικόνα:Tsalmasd_eikona_3.4.png|thumb|right|Εικόνα 4: Ανίχνευση παράνομης δόμησης της Jiangxi στην Κίνα]]
+
[[Εικόνα:Tsalmasd_eikona_3.4.png|thumb|right|'''Εικόνα 4:''' Ανίχνευση παράνομης δόμησης της Jiangxi στην Κίνα]]

Παρούσα αναθεώρηση της 20:17, 1 Μαρτίου 2022

Εικόνα 1: Δομή πολυ-επίπεδης κατάτμησης
Εικόνα 2: Πίνακας αποτελεσμάτων ακρίβειας κατάτμησης
Εικόνα 3: Σύγκριση αποτελεσμάτων κατάτμησης
Εικόνα 4: Ανίχνευση παράνομης δόμησης της Jiangxi στην Κίνα


Πίνακας περιεχομένων

Illegal Constructions Detection in Remote Sensing - Images based on Multi-scale Semantic Segmentation

Συγγραφείς:Chen Chen, Jiaxuan Deng, Ning Lv

Σύνδεσμος πρωτότυπου κειμένου: [[1]]

Λέξεις κλειδιά:σύνθετη σημασιολογική κατάτμηση, συνέλιξη πολλαπλής κλίμακας, τυχαίο πεδίο

1. Αντικείμενο

Ο πολεοδομικός σχεδιασμός αποτελεί σημαντικό πεδίο εφαρμογής των εικόνων τηλεπισκόπησης. Η χρήση της σημασιολογικής κατάτμησης για τον πολεοδομικό σχεδιασμό παρουσιάζει μεγάλες δυνατότητες, ωστόσο, το να επιτευχθεί μια πολύπλοκη σημασιολογική κατάτμηση απέχει ακόμη. Για τη βελτίωση της ικανότητας εκμάθησης πολύπλοκων κανόνων σε ένα δίκτυο σημασιολογικής κατάτμησης πρέπει να υποδεικνύεται ρητά η περιεχόμενη σύνδεση μεταξύ των κατηγοριών/τμημάτων. Το παρόν δημοσίευμα προτείνει μια νέα δομή συνέλιξης η οποία βασίζεται στο τρέχον δίκτυο σημασιολογικής κατάτμησης με τη δομή κωδικοποίησης-αποκωδικοποίησης. Η παραδοσιακή πολυεπίπεδη δομή συνέλιξης αντικαθίσταται από μια νέα, παράλληλη δομή συνέλιξης πολλαπλών κλιμάκων. Επιπλέον, μια πλήρης σύνδεση συνεχούς τυχαίου πεδίου κάτω από ορισμένους κανόνες προστίθεται για τον περιορισμό των αποτελεσμάτων της κατάτμησης. Για την ακρίβεια της κατάτμησης πρώτα γίνεται η σύγκριση με το τρέχον δίκτυο κατάτμησης σε ανοιχτά σύνολα δεδομένων, και έχει δείξει καλή εφαρμογή και πρακτικότητα όσον αφορά τον εντοπισμό παράνομων κατασκευών στην επαρχία Jiangxi, Κίνα.

2. Εισαγωγή

Η σημασιολογική κατάτμηση της εικόνας είναι μια διαδικασία κατανόησης εικόνας η οποία βασίζεται σε προγενέστερη γνώση. Ένα βαθύ συνελικτικό δίκτυο μπορεί να συνδέσει τα οπτικά χαρακτηριστικά της εικόνας με την υψηλού επιπέδου σημασιολογική έννοια μέσω της διαδικασίας «έμπειρης» μηχανικής μάθησης. Αυτή η σύνδεση χρησιμοποιεί την οπτική ομοιότητα μεταξύ εικόνων ώστε να μιμηθεί την ανθρώπινη κρίση, η οποίες βασίζεται στη σημασιολογική ομοιότητα.

Στη σημασιολογική κατάτμηση Τηλεπισκοπικών εικόνων, υπάρχουν αντικείμενα διαφόρων μεγεθών, κάποια από τα οποία καταλαμβάνουν ολόκληρη την κομμένη εικόνα, ενώ άλλα είναι μόνο μερικά (λίγα) εικονοστοιχεία. Σε διαφορετικές εφαρμογές, π.χ. ανίχνευση οχημάτων, αναγνώριση προσώπου, και οι δύο αυτοί στόχοι είναι σημαντικοί. Τα περισσότερα από τα υπάρχοντα δίκτυα κατάτμησης εικόνων έχουν αντιληπτά πεδία σταθερού μεγέθους και η αντιστοίχιση μεταξύ εικόνων και σημασιολογίας διερευνάται μέσα από όλο και βαθύτερες δομές δικτύων, γεγονός το οποίο δεν είναι τόσο θετικό για την αποτελεσματικότητα των πεδίων εκπαίδευσης και την ικανότητα γενίκευσης του δικτύου.

Το παρόν δημοσίευμα τροποποιεί τη δομή κωδικοποίησης-αποκωδικοποίησης σε δίκτυα κατάτμησης για αντικείμενα πολλαπλών κλιμάκων στις τηλεπισκοπικές εικόνες. Η συνέλιξη στη διαδικασία της μάθησης χαρακτηριστικών και ταξινόμησης αλλάζει. Η παραδοσιακή συνέλιξη πολλαπλών επιπέδων υπέρθεση πυρήνα με σταθερό μέγεθος αλλάζει σε μια μέθοδο που συνδέει μέσω πολλαπλών κλιμάκων το πεδίο αισθητήρων με παράλληλη επεξεργασία. Ταυτόχρονα, αποτελεί μια πολύ αποτελεσματική μέθοδο, καθώς δεν απαιτεί τα δεδομένα εκπαίδευσης και τους υπολογιστικούς πόρους για την βελτίωσή της. Χρησιμοποιείται ένα πυκνό τυχαίο πεδίο υπό όρους ώστε να περιοριστεί το αποτέλεσμα της κατάτμησης. Κάνοντας τη σχέση μεταξύ των κατηγοριών πιο σαφείς, έχει βελτιωθεί σημαντικά ο χειρισμός ορισμένων ζητημάτων πολεοδομικού σχεδιασμού και χρήσης γης για τις μεταφορές, για τους φυσικός πόρους, τις έξυπνες πόλεις κ.λπ.

Ως δίκτυο για τη σημασιολογική κατάτμηση Τηλεπισκοπικών εικόνων, συγκρίνεται η ακρίβειά του με τις τρέχουσες άριστες ακρίβειες των δικτύων κατάτμησης στο ανοιχτό σύνολο δεδομένων τηλεπισκόπησης. Η ακρίβεια είναι παρόμοια με αυτή του καλύτερου αποτελέσματος και συγκλίνει γρηγορότερα. Για την ανίχνευση παράνομων κτισμάτων σε ορισμένο τόπο, πρέπει να γίνει ανίχνευση των άκτιστων κτιρίων ή αυτών που είναι χτισμένα σε λάθος περιοχή. Με βάση τον παραπάνω κανόνα, δείχνει υψηλή ακρίβεια ανίχνευσης.

3. Περιοχή μελέτης

Η πρώτη σύγκριση απόδοσης προέρχεται από σύνολα δεδομένων αστικών κτιρίων στη Μασαχουσέτη και χρησιμοποιούνται ορισμένες μέθοδοι βελτίωσης δεδομένων. Το σύνολο των δεδομένων είναι περίπου 5000 δείγματα τα οποία (224,224,3) χωρίζονται σε τρία μέρη, αυτά της εκπαίδευσης, της διασταύρωσης και δοκιμής.

Στην εφαρμογή ανίχνευσης παράνομων κατασκευών, χαρακτηρίστηκαν χειροκίνητα οι υποπεριοχές ως περιοχές εκπαίδευσης. Στη συνέχεια, χρησιμοποιήθηκε αυτό το μοντέλο για την πρόβλεψη ολόκληρης της περιοχής.

4. Επισκόπηση

Το συνολικό πλαίσιο του μοντέλου που χρησιμοποιείται φαίνεται στο Σχήμα 1, το οποίο βασίζεται σε ένα δίκτυο σημασιολογικής κατάτμησης από άκρο σε άκρο στη δομή κωδικοποίησης-αποκωδικοποίησης. Η διαδικασία της συνέλιξης του σταδίου εξαγωγής χαρακτηριστικών που χρησιμποποιήθηκε, είναι εμπνευσμένη από τη δομή του DeepLab που χρησιμοποιεί πυρήνες συνέλιξης διαφορετικών μεγεθών ώστε να συνδυάσει τους χάρτες χαρακτηριστικών αντίστοιχα και μετά συνδέει τα αποτελέσματα.

Αποτελέσματα σε αντίθεση με την κοίλη συνέλιξη σταθερού μεγέθους, το μέγεθος του πυρήνα συνέλιξης κάθε γραμμής είναι διαφορετικό. Το βάθος της κάθε διαδρομής στον χάρτη χαρακτηριστικών είναι διαφορετικό. Μετά από αυτό, το βάρος θα ρυθμιστεί περαιτέρω από το δίκτυο εκπαίδευσης.

Τα περισσότερα δίκτυα κατάτμησης εικόνων βασίζονται στο CNN δίκτυο. Για καλύτερα αποτελέσματα ταξινόμησης, το CNN «στοιβάζει» περισσότερα και περισσότερα μετατρεπτικά επίπεδα. Ταυτόχρονα, επιφέρει προβλήματα όπως η διασπορά κλίσης και η αργή ταχύτητα. Η δομή διασύνδεσης επιπέδων όπως το ResNet και το DenseNet επιτρέπει στο δίκτυο να αναπτυχθεί βαθύτερα. Ωστόσο, το δίκτυο κατάτμησης της εικόνας όχι μόνο βρίσκει τα σωστά αποτελέσματα ταξινόμησης αλλά χρειάζεται επίσης να αποκαταστήσει τη χωρική σχέση των αποτελεσμάτων της ταξινόμησης. Εξάλλου, η συμμετρική δομή αποκωδικοποίησης κάνει το βάθος του πολλαπλασιασμού του δικτύου, κάτι που αποτελεί μεγάλη πρόκληση για την διάδοση κλίσης και την απαιτούμενη ποσότητα τμημάτων εκπαίδευσης.

5. Αποτελέσματα

Αυτά τα δίκτυα σημασιολογικής τμηματοποίησης με καλή απόδοση επιλέγονται ως γραμμές βάσης. Όπως φαίνεται στον Πίνακα 1, αποτελούν σχετικά εξέχοντα δίκτυα, το UresNet το οποίο είναι ένα Unet που χρησιμοποιεί το ResNet ως βασικό δίκτυο και το In-net είναι η μέθοδος που χρησιμοποιείται σε αυτό το άρθρο.

Οι εικόνες που επιλέχθηκαν για την απεικόνιση είναι αρκετά αντιπροσωπευτικές και μπορεί να έχουν μικρά αντικείμενα, μεγάλα αντικείμενα και περιοχές με ανώμαλες άκρες. Όπως φαίνεται στο Σχ. 3, αν και το βαθύτερο δίκτυο όπως το UresNet μπορεί να εντοπίσει τους στόχους, δεν μπορεί να διαχωρίσει καλά τα όρια. Τα δύο δίκτυα είναι παρόμοια όσον αφορά την ικανότητα αναγνώρισης στόχων. Το αποτέλεσμα της διαδικασίας CRF για την επεξεργασία ορίων είναι πολύ σημαντικά. Οι οδοντωτές άκρες στο τρίτο είναι προφανείς, αλλά αυτό το χαρακτηριστικό εκφράζεται σε άλλα δίκτυα κατάτμησης χωρίς γωνίες.

Η μέθοδος της παρούσας μελέτης χρησιμοποιήθηκε σε ένα έργο του οποίου ο σκοπός ήταν ο εντοπισμός των παράνομων κτιρίων. Οι στόχοι εντοπισμού ήταν άκτιστα κτίρια και κτίρια που χτίστηκαν σε λάθος μέρος.

Ο εντοπισμός παράνομων κατασκευών φαίνεται στην εικόνα 4 Αξίζει να σημειωθεί πως η αρχική εικόνα είναι μια εικόνα μεγάλης κλίμακας. Η πρώτη εικόνα είναι δορυφορική εικόνα με ετικέτες σημειωμένες (χειροκίνητα) και δείχνει τις παράνομες περιοχές. Στη δεύτερη εικόνα, υπάρχουν τρία είδη ετικετών:

  • Οι λευκές γραμμές αντιπροσωπεύουν την περιοχή που έχει σημειωθεί σωστά
  • Οι κόκκινες γραμμές αντιπροσωπεύουν την περιοχή που σημειώθηκε εσφαλμένα και
  • Οι μπλε γραμμές αντιπροσωπεύουν την περιοχή που δεν έχει εντοπιστεί καθόλου.

Το δίκτυο παρουσίασε αρκετά καλή απόδοση και αποτελεσματικότητα σε αυτή την περίπτωση, ακόμη και αν το δείγμα των sample tests ήταν μεγάλο.

6.Επίλογος

Από αυτά τα πειραματικά αποτελέσματα, παρατηρείται ότι στη σημασιολογική κατάτμηση Τηλεπισκοπικών εικόνων, η συνέλιξη πολλαπλών κλιμάκων που σχετίζεται με το πλαίσιο έχει μεγάλη συμβολή στη βελτίωση της ακρίβειας. Αυτό το συμπέρασμα επαληθεύεται επίσης και στις πραγματικές εικόνες τηλεπισκόπησης μεγάλου μήκους οι οποίες περιέχουν πολλαπλούς τύπους εδάφους.

Προσωπικά εργαλεία