Βελτιστοποίηση της ανίχνευσης κτιρίων σε δορυφορικές εικόνες Landsat και Spot συνδυάζοντας πολυφασματική ταξινόμηση και φίλτρα υφής.

Από RemoteSensing Wiki

Μετάβαση σε: πλοήγηση, αναζήτηση


Βελτιστοποίηση ανίχνευσης κτιρίων σε δορυφορικές εικόνες Landsat και Spot συνδυάζοντας πολυφασματική ταξινόμηση και φίλτρα υφής.
Πρωτότυπος τίτλος : Optimisation of building detection in satellite images by combining multispectral classification and texture filtering
Πηγή : Yun Zhang, ISPRS Journal of Photogrammetry & Remote Sensing 54_199 pp 50–60 [4]

Περίληψη

Οι συμβατικές πολυφασματικές μέθοδοι, παρουσιάζουν μέτρια επίδοση όσον αφορά την ανίχνευση των αντικειμένων αστικών κατηγοριών, όπως κτίρια σε δορυφορικές εικόνες υψηλής χωρικής ανάλυσης. Αυτό οφείλεται στο ότι τα αντικείμενα στις αστικές περιοχές έχουν περίπλοκα χωρικά και φασματικά χαρακτηριστικά. Η πολυφασματική ταξινόμηση ανιχνεύει κατηγορίες αντικειμένων μόνο σύμφωνα με τις φασματικές πληροφορίες μεμονωμένων pixels, ενώ οι χωρικές πληροφορίες παραμελούνται. Εδώ, περιγράφεται μια τεχνική η οποία προσπαθεί να ανιχνεύσει τα αστικά κτίρια σε δύο φάσεις. Αρχικά πραγματοποιείται η συμβατική πολυφασματική ταξινόμηση. Στη συνέχεια, η ταξινόμηση των κτιρίων βελτιώνεται με τη βοήθεια των χωρικών πληροφοριών μέσω ενός τροποποιημένου φίλτρου co-occurrence (συνεμφάνισης). Η προτεινόμενη αυτή μέθοδος είναι πολύ χρήσιμη για μια γρήγορη εκτίμηση των αστικών κτιρίων και της ανάπτυξης των πόλεων, ειδικά στις μητροπολιτικές περιοχές των αναπτυσσόμενων χωρών.

Η περιοχή μελέτης και ο στόχος για την περιοχή

Η περιοχή μελέτης είναι η πόλη της Σαγκάη στην Κίνα[5]. Καλύπτει μια περιοχή των 30x30 χιλιομέτρων προσεγγιστικά . Τα κτίρια της πόλης που είναι περίπου 12-20m πλάτους, είναι κατά βάση κατοικημένα πρόκειται για σπίτια που χτίζονται από το 1949 και ιδιαίτερα από το 1979. Aυτό το είδος κτιρίων διαμορφώνει τα συνηθισμένα αστικά χαρακτηριστικά γνωρίσματα στις δορυφορικές εικόνες. Καλύπτουν το 50% ολόκληρης της κατοικήσιμης περιοχής και αναπτύσσονται όλο και πιο δυναμικά γι’ αυτό και η ανίχνευσή τους είναι και ο βασικός στόχος της μελέτης αυτής. Τα άλλα είδη κτιρίων στην περιοχή αυτή είναι ψηλά κτίρια με περισσότερα από 10 πατώματα, παλαιά μικρά κτίρια, τοποθετημένα πολύ κοντά το ένα στο άλλο αλλά και μικρά παραδοσιακά και ακανόνιστα σπίτια. Τα παλαιά μικρά κτίρια και όσα είναι φτιαγμένα από παραδοσιακά υλικά (π.χ. πέτρες), λόγω μικρού μεγέθους και κοντινής απόστασης μεταξύ τους δεν μπορούν να αναγνωριστούν ούτε με οπτική ερμηνεία (φωτοερμηνεία) στην συγχωνευμένη (merged) εικόνα η οποία προέκυψε από την απεικόνιση Landsat TM (30m διακριτική ικανότητα) και Spot παγχρωματική (10m διακριτική ικανότητα), και γι’ αυτό το λόγο δεν μπορούν να εξαχθούν (να χαρτογραφηθούν, να αναγνωρισθούν στη δορυφορική εικόνα) στην παρούσα εργασία.

Εικόνα 1 : Κτίρια ανιχνευμένα με πολυφασματική ταξινόμηση από συγχωνευμένα TM-SPOT δεδομένα στη πόλη Shangai,βόρειο και νότιο τμήμα, [1]πηγή



Μεθοδολογία

Για την ανίχνευση των κτιρίων που αποτελούνται από 12-20 μέτρα πλάτος, χρησιμοποιήθηκαν συγχωνευμένες TM-SPOT (μέγεθος pixel 10m) εικόνες. Η μέθοδος συγχώνευσης ήταν η μετατροπή IHS[6]. Τα στοιχεία που χρησιμοποιήθηκαν για την συγχώνευση ήταν τα TM κανάλια 3, 4 και 7 παρμένα από LANDSAT 5 στις 18 Μαϊου 1987 και τα SPOT παγχρωματικά δεδομένα λήφθηκαν από δέκτες HRV2 του STOT 1 στις 25 Οκτώβρη 1989. Eξαιτίας της περιορισμένης επιλογής η πηγή δεδομένων που χρησιμοποιήθηκε έχει μια χρονική διαφορά δύo ετών. Η διαφορά της χρονικής διάρκειας μειώνει την ακρίβεια της πολυφασματικής ταξινόμησης αλλά όχι το φιλτράρισμα υφής, το βασικό κομμάτι της μελέτης. Η μη επιβλεπόμενη ISODATA μέθοδος συγκέντρωσης χρησιμοποιήθηκε για την πολυφασματική ταξινόμηση των κτιρίων. Οι μέθοδοι της ανάλυσης υφής συχνά χρησιμοποιούνται για την αναγνώριση και τη διάκριση διαφορετικών χωρικών χαρακτηριστικών σε ψηφιακές εικόνες. Η εικόνα παραγωγής από την ανάλυση υφής ταξινομείται άμεσα ή χρησιμοποιείται ως πρόσθετη ζώνη μαζί με άλλα πολυφασματικά κανάλια στην ταξινόμηση. Εδώ, ο πίνακας συνεμφάνισης (co-occurrence), χρησιμοποιήθηκε για να ανιχνεύσει αντικείμενα με διαφορετικά μεγέθη και κατευθύνσεις. Οι τιμές του co-occurrence πίνακα σε 4 διαγώνιες κατευθύνσεις υπολογίστηκαν με απόσταση ανά ένα pixel και μέγεθος παραθύρου 3x3 και 5x5 και έπειτα ακολούθησαν οι μετρήσεις των τεσσάρων γνωρισμάτων υφής από κάθε πίνακα co-occurrence, ενέργεια, αντίθεση, εντροπία, ομοιογένεια. Όλες οι παραπάνω εικόνες μέτρου υφής για κάθε κατεύθυνσης είναι των 8 bit. Οι γκρίζες τιμές αυτών των εικόνων αντιπροσωπεύουν το μέγεθος του αντικειμένου, δηλαδή όσο μεγαλύτερο είναι το μέγεθος του αντικειμένου, τόσο εντονότερη η γκρίζα απόχρωση κι έτσι τα αντικείμενα διαφορετικών μεγεθών διαχωρίζονται εύκολα. Οι εικόνες γκρίζων τιμών υποδιαιρέθηκαν σε ομάδες χρησιμοποιώντας την ISODATA μέθοδο συγκέντρωσης. Αυτές οι 50 ομάδες ερμηνεύτηκαν χειροκίνητα, επικαλύπτοντας ακριβώς στη συγχώνευση έγχρωμης εικόνας TM-SPOT και χρησιμοποιώντας τις τεχνικές για κάθε ομάδα για να ελεγχθεί αν αυτό ανήκει στην κατηγορία να ταξινομηθεί στην πρότυπη εικόνα. Στην παρούσα εργασία, τα κτίρια αποτελούνται από 6 ομάδες ενώ άλλες ομάδες ορίστηκαν σε θορυβώδεις περιοχές ή σε ραδιομετρικά «θορυβώδεις» περιοχές (περιοχές background). Βέβαια οι εικόνες θα μπορούσαν να υποδιαιρεθούν σε περισσότερες από 50 ομάδες, αλλά η ερμηνεία θα γινόταν πιο δύσκολη και χρονοβόρα. Οι 4 διαγώνιες κατευθύνσεις χρησιμοποιήθηκαν επειδή οι τοίχοι των περισσότερων κτιρίων στην περιοχή μελέτης βρίσκονταν στις διαγώνιες κατευθύνσεις της εικόνας. Χρησιμοποιώντας αυτή τη παραδοχή, τα κτίρια μπορούν να διαχωριστούν καλύτερα από το θόρυβο. Τα αποτελέσματα του φιλτραρίσματος φαίνονται στον πίνακα που επισυνάπτω, χρησιμοποιώντας ένα πίνακα 3x3 και την μέτρηση της υφής της ομοιογένειας. Η εξάρτηση κατεύθυνσης των πινάκων συνεμφάνισης (co-occurred) φαίνεται ξεκάθαρα στα αποτελέσματα φιλτραρίσματος του αερολιμένα στα δεξιά και στο σιδηρόδρομο στο κατώτατο σημείο δεξιά για κάθε κατεύθυνση, όπου η μία πλευρά αιχμής των αντικειμένων δεν μπορεί να φιλτραριστεί. Κατά συνέπεια, οι αιχμές μεγάλων μη κτιριακών αντικειμένων, είναι ταξινομημένες ως κτίρια. Με τη συγχώνευση των αποτελεσμάτων των κτιριακών κατηγοριών σε κάθε μια από τις 4 κατευθύνσεις που χρησιμοποιούν ένα λογικό AND, αυτό το πρόβλημα είναι ικανό να λυθεί. Ομοίως, οι περιοχές θορύβου στις 4 κατευθύνσεις συγχωνεύονται από ένα λογικό OR, ενώ η υπόλοιπη περιοχή ορίζεται στις ραδιομετρικά «θορυβώδεις» περιοχές. Το καλύτερο αποτέλεσμα, μεταξύ των 2 διαφορετικών μεγεθών παραθύρων και των τεσσάρων μετρήσεων υφής, επιτεύχθηκε με τη χρήση ενός 3x3 μεγέθους pixel και της μέτρου υφής ομογένειας (βλ. Εικόνα2)

Εικόνα 2 : Αποτελέσματα της ανίχνευσης εικόνων μετά τη χρήση του co-occurrence πίνακα φιλτραρίσματος σε κάθε μία από τις τέσσερεις διαγώνιες κατευθύνσεις, [2]πηγή

Για λόγους σύγκρισης (των διαφορετικών μεθόδων φίλτρων υφής), χρησιμοποιήθηκε επίσης μια κανονική μέθοδος ανάλυσης υφής για να φιλτράρει τα πολυφασματικά ταξινομημένα κτίρια χρησιμοποιώντας τα ίδια μέτρα υφής και τα μεγέθη παραθύρων. Οι μετρήσεις υφής υπολογίστηκαν όπως πριν μόνο που χρησιμοποιήθηκαν οι δυαδικές τιμές της πολυφασματικής ταξινόμησης αντί των τιμών των (co-occurrence) πινάκων συνεμφάνισης. Τα καλύτερα αποτελέσματα επιτεύχθηκαν με τη χρήση ενός παραθύρου pixel 3x3 και των μετρήσεων υφής ενέργειας και ομοιογένειας. Η οπτική σύγκριση των εικόνων στην εικόνα 1b και 5a,c,e δείχνουν καθαρά ότι το αεροδρόμιο, η σιδηροδρομική τροχιά, τα τμήματα των δρόμων και τα γυμνάσια φιλτραρίστηκαν πολύ καθαρά. Αντίθετα, μόνο κάποια αποκλείστηκαν στην εικόνα 5c,e. Το πλεονέκτημα του co-occurrence πίνακα βασισμένου στο φιλτράρισμα , πέρα από το κανονικό φιλτράρισμα ανάλυσης, παρουσιάζεται ξεκάθαρα μέσω αυτής της σύγκρισης. Στις εικόνες 1a και 5b παρουσιάζεται ένα ακόμη τμήμα των αποσπασματικών κτιρίων πρίν και μετά το φίλτρο υφής. Μέσω της οπτικής παρατήρησης είναι ευδιάκριτο το μεγάλο μέρος της περιοχής του θορύβου που βρίσκεται μέσα στο αποτέλεσμα της πολυφασματικής ταξινόμησης. the co-occurrence matrix based filtering and the normal texture analysis filtering is also clearly visible by comparing Fig. 5b and f, αντίστοιχα. Η ίδια μέτρηση υφής ομοιογένειας χρησιμοποιήθηκε και στις δύο μεθόδους.

Εικόνα 3 : Σύγκριση αποτελεσμάτων ανίχνευσης κτιρίων χρησιμοποιώντας διαφορετικές μεθόδους φιλτραρίσματος με πίνακα μέγεθος 3x3 ((500x360 τμήματος pixel). [3]πηγή



Αξιολόγηση

Προκειμένου να αξιολογηθεί η ακρίβεια των αποτελεσμάτων η συγχωνευμένη κοντινή και φυσικού χρώματος εικόνα, TM-SPOT χρησιμοποιήθηκε ως αναφορά. Η μέθοδος των τυχαίων σημείων εφαρμόστηκε σε τρεις περιοχές των 600x400 pixels. Η πρώτη εξεταζόμενη περιοχή ήταν στο νότιο μέρος της πόλης όπου τα πρόσφατα χτισμένα κατοικημένα σπίτια που έχουν περίπου πλάτος 12-20m, υπερισχύουν. Η δεύτερη περιοχή ήταν στη βόρεια πλευρά της πόλης, όπου η πλειοψηφία των κτιρίων είναι πρόσφατα χτισμένα κατοικημένα σπίτια και μόνο ένα μέρος τους είναι παλαιά. Η τρίτη περιοχή ήταν στη μέση της πόλης, όπου τα παλαιά μικρά κτίρια επικρατούν με μερικά μεγάλα κτίρια διασκορπισμένα ανάμεσά τους. Τα κτίρια καλύπτουν κατά μέσο όρο το 10% των τριών αυτών περιοχών. Τα κτίρια ήταν κατά βάση 1-2 pixels πλάτους. Συνολικά 400 τυχαία σημεία συλλέχθηκαν ως pixels αναφοράς σε κάθε μία από τις τρείς περιοχές δοκιμής και ταξινομήθηκαν με το χέρι. Η χρονική διαφορά μεταξύ TM και SPOT εικόνων δεν επηρέασε την οπτική ανίχνευση των κτιρίων, δεδομένου ότι μπόρεσε να γίνει με τη χρησιμοποίηση της υψηλότερης χωρικής ανάλυσης από το SPOT, ανεξάρτητα από τη φασματική πληροφορία των εικόνων TM. Το μικτό ποσοστό των pixels ήταν πολύ υψηλό στις εικόνες TM-SPOT. Γι’ αυτό ήταν δύσκολο να καθοριστεί με ακρίβεια πότε ένα τυχαίο σημείο των αιχμών κτιρίων ανήκε σε ένα κτίριο ή στο background. Σε καμία από τις τρεις περιοχές δεν υπήρξε τέτοιο λάθος αφού τα αυτόματα ανιχνευμένα κτίρια επιστρώθηκαν στις εικόνες αναφοράς. Η ακρίβεια χρηστών για μία κατηγορία ορίζεται ως η αναλογία των σωστά ταξινομημένων αντικειμένων από το συνολικό αριθμό των αντικειμένων (pixels) καταταγμένο σε αυτή τη κατηγορία και σχετίζεται με τα λάθη της commission. Η ακρίβεια χρηστών και το k στατιστικό των εξαγόμενων κτιρίων μετά τον co-occurrence πίνακα βασισμένο στο φιλτράρισμα είναι σημαντικά υψηλότερο από πρίν σε όλες τις εξεταζόμενες περιοχές. Μετά τη βελτίωση του co-occurrence πίνακα, η μέση ακρίβεια χρηστών των τριών περιοχών αυξάνεται από 59% σε 86% και η μέση τιμή κ αυξάνεται από 0,54 σε 0,85 βελτιώνοντας και τις δύο μετρήσεις ακρίβειας αντίστοιχα. Τα αποτελέσματα της 1ης περιοχής είναι καλύτερα από της 2ης , αφού η 2η έχει αναλογικά τα περισσότερα μη οικοδομήσιμα κτίρια. Τα αποτελέσματα της 3ης περιοχής ήταν τα καλύτερα διότι τα μεγάλα κτίρια είχαν διαφορετικά υλικά στεγών από αυτά των μικρών με τις σκοτεινές στέγες. Κατά συνέπεια, είχαν διαφορετικά φασματικά χαρακτηριστικά επομένως ήταν και πιο ευδιάκρτιτα. Η βελτίωση ακρίβειας μέσω του κανονικού φιλτραρίσματος ανάλυσης υφής με την ομοιογένεια μέτρου υφής αξιολογήθηκε στην πρώτη εικόνα προκειμένου να το συγκρίνει με τον πίνακα co-occurrence βασισμένο στο φιλτράρισμα. Η μέθοδος αξιολόγησης ήταν όπως παραπάνω και τα αποτελέσματα ακρίβειας παρουσιάζονται στον Πίνακα 1. Η ακρίβεια των χρηστών αυξάνεται από 49% σε 69% με το κανονικό φιλτράρισμα ανάλυσης υφής και σε 86% με τον πίνακα co-occurrence βασισμένο στο φιλτράρισμα, δηλαδή προκύπτει βελτίωση της ακρίβειας της τελευταίας μεθόδου έναντι της πρώτης κατά 25%.

Συμπεράσματα

Είναι προφανές ότι η ακρίβεια της ανίχνευσης κτιρίων σε δορυφορικές εικόνες δεν είναι ιδιαίτερα ικανοποιητική για λεπτομερή έρευνα της αστικής περιοχής η για τις εφαρμογές μεγάλης κλίμακας των GIS. Παρόλα αυτά, το αποτέλεσμα αυτής της μελέτης είναι πού χρήσιμο για μια γρήγορη εκτίμηση των αστικών κτισμάτων και της ανάπτυξης των πόλεων.