Βελτιστοποίηση της ανίχνευσης κτιρίων σε δορυφορικές εικόνες Landsat και Spot συνδυάζοντας πολυφασματική ταξινόμηση και φίλτρα υφής.
Από RemoteSensing Wiki
Βελτιστοποίηση ανίχνευσης κτιρίων σε δορυφορικές εικόνες συνδυάζοντας πολυφασματική ταξινόμηση και φίλτρα υφής χρησιμοποιώντας δορυφορικές εικόνες Landsat και Spot..
Πρωτότυπος τίτλος : Optimisation of building detection in satellite images by
combining multispectral classification and texture filtering
Πηγή : Yun Zhang, ISPRS Journal of Photogrammetry & Remote Sensing 54 _1999. 50–60
[http://www.sciencedirect.com/science?_ob=MImg&_imagekey=B6VF4-3W4XJ1F-5-H&_cdi=6000&_user=83473&_pii=S0924271698000276&_origin=search&_zone=rslt_list_item&_coverDate=02%2F28%2F1999&_sk=999459998&wchp=dGLzVlz-zSkWb&md5=cb172db6ff6d255a5119e0813c601a59&ie=/sdarticle.pdf
Περίληψη
Οι συμβατικές πολυφασματικές μέθοδοι, παρουσιάζουν μέτρια επίδοση όσον αφορά την ανίχνευση των αντικειμένων αστικών κατηγοριών, όπως κτίρια, σε δορυφορικές εικόνες υψηλής χωρικής ανάλυσης. Αυτό οφείλεται στο ότι τα αντικείμενα στις αστικές περιοχές έχουν περίπλοκα χωρικά και φασματικά χαρακτηριστικά. Η πολυφασματική ταξινόμηση ανιχνεύει κατηγορίες αντικειμένων μόνο σύμφωνα με τις φασματικές πληροφορίες μεμονωμένων pixels, ενώ οι χωρικές πληροφορίες παραμελούνται. Εδώ, περιγράφεται μια τεχνική η οποία προσπαθεί να ανιχνεύσει τα αστικά κτίρια σε δύο φάσεις. Αρχικά πραγματοποιείται η συμβατική πολυφασματική ταξινόμηση. Στη συνέχεια, η ταξινόμηση των κτιρίων βελτιώνεται με τη βοήθεια των χωρικών πληροφοριών μέσω ενός τροποποιημένου co-occurrence φιλτραρίσματος. Η προτεινόμενη αυτή μέθοδος είναι πολύ χρήσιμη για μια γρήγορη εκτίμηση του αστικού κτιρίου και της ανάπτυξης των πόλεων, ειδικά στις μητροπολιτικές περιοχές των αναπτυσσόμενων χωρών.
Η περιοχή μελέτης και ο στόχος για την περιοχή
Η περιοχή μελέτης είναι η πόλη της Σαγκάη στην Κίνα. Καλύπτει μια περιοχή των 30x30 km προσεγγιστικά . Τα κτίρια της πόλης που είναι περίπου 12-20m πλάτους, είναι κατά βάση κατοικημένα σπίτια που χτίζονται από το 1949 και ιδιαίτερα από το 1979. Aυτό το είδος κτιρίων διαμορφώνει τα συνηθισμένα αστικά χαρακτηριστικά γνωρίσματα στις δορυφορικές εικόνες. Καλύπτουν το 50% ολόκληρης της κατοικήσιμης περιοχής και αναπτύσσονται όλο και πιο δυναμικά γι’ αυτό και η ανίχνευσή τους είναι και ο βασικός στόχος της μελέτης αυτής. Τα άλλα είδη κτιρίων στην περιοχή αυτή είναι ψηλά κτίρια με περισσότερα από 10 πατώματα, παλαιά μικρά κτίρια, τοποθετημένα πολύ κοντά το ένα στο άλλο αλλά και μικρά παραδοσιακά και ακανόνιστα σπίτια. Τα παλαιά μικρά κτίρια και όσα είναι φτιαγμένα από παραδοσιακά υλικά (π.χ. πέτρες), λόγω μικρού μεγέθους και κοντινής απόστασης μεταξύ τους δεν μπορούν να αναγνωριστούν ούτε με οπτική ερμηνεία (φωτοερμηνεία) στην συγχωνευμένη (merged) εικόνα η οποία προέκυψε από την απεικόνιση Landsat TM (30m διακριτική ικανότητα) και Spot παγχρωματική (10m διακριτική ικανότητα), και γι’ αυτό το λόγο δεν μπορούν να εξαχθούν (να χαρτογραφηθούν, να αναγνωρισθούν στη δορυφορική εικόνα) στην παρούσα εργασία.
Μεθοδολογία
Για την ανίχνευση των κτιρίων που αποτελούνται από 12-20 μέτρα πλάτος, χρησιμοποιήθηκαν συγχωνευμένες TM-SPOT (μέγεθος pixel 10m) εικόνες. Η μέθοδος συγχώνευσης ήταν η μετατροπή IHS. Τα στοιχεία που χρησιμοποιήθηκαν για την συγχώνευση ήταν τα TM κανάλια 3,4 και 7 παρμένα από LANDSAT 5 στις 18 Μαϊου 1987 και το SPOT Pan data λήφθηκε από δέκτες HRV2 του STOT 1 στις 25 Οκτώβρη 1989. Eξαιτίας της περιορισμένης επιλογής η πηγή δεδομένων που χρησιμοποιήθηκε έχει μια χρονική διαφορά δύo ετών. Αυτό οφείλεται σε μία μείωση ακρίβειας αποτελεσμάτων to some extent. Η διαφορά της χρονικής διάρκειας μειώνει την ακρίβεια της πολυφασματικής ταξινόμησης αλλά όχι το φιλτράρισμα υφής, το βασικό κομμάτι της μελέτης. Η μη επιβλεπόμενη ISODATA μέθοδος συγκέντρωσης χρησιμοποιήθηκε για την πολυφασματική ταξινόμηση των κτιρίων.Οι μέθοδοι της ανάλυσης υφής συχνά χρησιμοποιούνται για την αναγνώριση και τη διάκριση διαφορετικών χωρικών χαρακτηριστικών σε ψηφιακές εικόνες. Η εικόνα παραγωγής από την ανάλυση υφής ταξινομείται άμεσα η χρησιμοποιείται ως πρόσθετη ζώνη μαζί με άλλα πολυφασματικά κανάλια στην ταξινόμηση. Εδώ, ο πίνακας co-occurrence, χρησιμοποιήθηκε για να ανιχνεύσει αντικείμενα με διαφορετικά μεγέθη και κατευθύνσεις. Οι τιμές του co-occurrence πίνακα σε 4 διαγώνιες κατευθύνσεις υπολογίστηκαν με απόσταση ανά ένα pixel και μέγεθος παραθύρου 3x3 και 5x5 και έπειτα ακολούθησαν οι μετρήσεις των τεσσάρων γνωρισμάτων υφής από κάθε πίνακα co-occurrence, ενέργεια, αντίθεση, εντροπία, ομοιογένεια. Όλες οι παραπάνω εικόνες μέτρου υφής για κάθε κατεύθυνσης είναι των 8 bit. Οι γκρίζες τιμές αυτών των εικόνων αντιπροσωπεύουν το μέγεθος του αντικειμένου, δηλαδή όσο μεγαλύτερο είναι το μέγεθος του αντικειμένου ,τόσο εντονότερη η γκρίζα απόχρωση κι έτσι τα αντικείμενα διαφορετικών μεγεθών διαχωρίζονται εύκολα. Οι εικόνες γκρίζων τιμών υποδιαιρέθηκαν σε ομάδες χρησιμοποιώντας την ISODATA μέθοδο συγκέντρωσης. Αυτές οι 50 ομάδες ερμηνεύτηκαν χειροκίνητα, επικαλύπτοντας ακριβώς στη συγχώνευση έγχρωμης εικόνας TM-SPOT και χρησιμοποιώντας fade-inrfade-out για κάθε ομάδα για να ελεγχθεί αν αυτό ανήκει στην κατηγορία να ταξινομηθεί στην πρότυπη εικόνα. Στην παρούσα εργασία, τα κτίρια αποτελούνται από 6 ομάδες ενώ άλλες ομάδες ορίστηκαν σε θορυβώδεις περιοχές ή background. Βέβαια εικόνες θα μπορούσαν να υποδιαιρεθούν σε περισσότερες από 50 ομάδες, αλλά η ερμηνεία θα γινόταν πιο δύσκολη και χρονοβόρα. Οι 4 διαγώνιες κατευθύνσεις χρησιμοποιήθηκαν επειδή οι τοίχοι των περισσότερων κτιρίων στην περιοχή μελέτης βρίσκονταν στις διαγώνιες κατευθύνσεις της εικόνας. Χρησιμοποιώντας αυτή τη παραδοχή, τα κτίρια μπορούν να διαχωριστούν καλύτερα από το θόρυβο. Τα αποτελέσματα του φιλτραρίσματος φαίνονται στον πίνακα που επισυνάπτω, χρησιμοποιώντας ένα παράθυρο 3x3 και την μέτρηση της σύστασης της ομοιογένειας. Η εξάρτηση κατεύθυνσης των πινάκων co-occurred φαίνεται ξεκάθαρα στα αποτελέσματα φιλτραρίσματος του αερολιμένα στα δεξιά και στο σιδηρόδρομο στο κατώτατο σημείο δεξιά για κάθε κατεύθυνση, η μία πλευρά αιχμής των αντικειμένων δεν μπορεί να φιλτραριστεί. Κατά συνέπεια, αιχμές μεγάλων μη κτιριακών αντικειμένων, είναι ταξινομημένες ως κτίρια. Με τη συγχώνευση των αποτελεσμάτων κτιριακών κατηγοριών σε κάθε μια από τις 4 κατευθύνσεις που χρησιμοποιούν ένα λογικό AND, αυτό το πρόβλημα είναι ικανό να λυθεί. Ομοίως, οι περιοχές θορύβου στις 4 κατευθύνσεις συγχωνεύονται από ένα λογικό OR, ενώ η υπόλοιπη περιοχή ορίζεται στο background. Το καλύτερο αποτέλεσμα, μεταξύ των 2 διαφορετικών μεγεθών παραθύρων και των τεσσάρων μετρήσεων συστάσεως, επιτεύχθηκε με τη χρήση ενός 3x3 μεγέθους pixel και της μέτρου υφής ομογένειας. (βλ. Εικόνα2)
Για λόγους σύγκρισης (διαφορετικών μεθόδων φίλτρων υφής), χρησιμοποιήθηκε επίσης μια κανονική μέθοδος ανάλυσης υφής για να φιλτράρει τα πολυφασματικά ταξινομημένα κτίρια χρησιμοποιώντας τα ίδια μέτρα υφής και τα μεγέθη παραθύρων. Οι μετρήσεις υφής υπολογίστηκαν όπως πριν μόνο που χρησιμοποιήθηκαν οι δυαδικές τιμές της πολυφασματικής ταξινόμησης αντί των τιμών των co-occurrence πινάκων. Τα καλύτερα αποτελέσματα επιτεύχθηκαν με τη χρήση ενός παραθύρου pixel 3*3 και των μετρήσεων υφής ενέργειας και ομοιογένειας. Η οπτική σύγκριση των εικόνων στην εικόνα 1b & 5a,c,e δείχνουν καθαρά ότι το αεροδρόμιο, η σιδηροδρομική τροχιά, τα τμήματα των δρόμων και τα γυμνάσια φιλτραρίστηκαν πολύ καθαρά. Αντίθετα, μόνο κάποια αποκλείστηκαν στην εικόνα 5c,e. Το πλεονέκτημα του co-occurrence πίνακα βασισμένου στοο φιλτράρισμα , πέρα από το κανονικό φιλτράρισμα ανάλυσης, παρουσιάζεται ξεκάθαρα μέσω αυτής της σύγκρισης. Στις εικόνες 1a και 5b ένα ακόμη τμήμα των αποσπασματικών κτιρίων πρίν και μετά το φίλτρο υφής. Μέσω οπτικής παρατήρησης είναι ευκρινές το μεγάλο μέρος της περιοχής του θορύβου που βρίσκεται μέσα στο αποτέλεσμα της πολυφασματικής ταξινόμησης. the co-occurrence matrix based filtering and the normal texture analysis filtering is also clearly visible by comparing Fig. 5b and f, αντίστοιχα. The same texture measure homogeneity was used in both methods.
Αξιολόγηση
Προκειμένου να αξιολογηθεί η ακρίβεια των αποτελεσμάτων η συγχωνευμένη κοντινή-φυσικού χρώματος εικόνα, TM-SPOT χρησιμοποιήθηκε ως αναφορά. Η μέθοδος των τυχαίων σημείων εφαρμόστηκε σε τρεις περιοχές 600*400 pixels. Η πρώτη εξεταζόμενη περιοχή ήταν στο νότιο μέρος της πόλης όπου τα πρόσφατα χτισμένα κατοικημένα σπίτια που έχουν περίπου πλάτος 12-20m, υπερισχύουν. Η δεύτερη περιοχή ήταν στη βόρεια πλευρά της πόλης, όπου η πλειοψηφία των κτιρίων είναι πρόσφατα χτισμένα κατοικημένα σπίτια και μόνο ένα μέρος τους είναι παλαιά. Η Τρίτη περιοχή ήταν στη μέση της πόλης, όπου παλαιά μικρά κτίρια επικρατούν με μερικά μεγάλα κτίρια διασκορπισμένα ανάμεσά τους. Τα κτίρια καλύπτουν κατά μέσο όρο το 10% των τριών αυτών περιοχών. Τα κτίρια ήταν κατά βάση 1-2 pixels πλάτους. Συνολικά 400 τυχαία σημεία συλλέχθηκαν ως pixels αναφοράς σε κάθε μία από τις τρείς περιοχές δοκιμής και ταξινομήθηκαν με το χέρι. Η χρονική διαφορά μεταξύ TM και SPOT εικόνων δεν επηρέασε την οπτική ανίχνευση των κτιρίων, δεδομένου ότι μπόρεσε να γίνει με τη χρησιμοποίηση της υψηλότερης χωρικής ανάλυσης από το SPOT, ανεξάρτητα από τη φασματική πληροφορία των εικόνων TM. Το μικτό ποσοστό των pixels ήταν πολύ υψηλό στις εικόνες TM-SPOT. Γι’ αυτό ήταν δύσκολο να καθοριστεί με ακρίβεια πότε ένα τυχαίο σημείο των αιχμών κτιρίων ανήκαν σε ένα κτίριο ή στο background. Σε καμία από τις τρεις περιοχές δεν υπήρξε τέτοιο λάθος αφού τα αυτόματα ανιχνευμένα κτίρια επιστρώθηκαν στις εικόνες αναφοράς.
Η ακρίβεια χρηστών για μία κατηγορία ορίζεται ως η αναλογία των σωστά ταξινομημένων αντικειμένων πέρα από το συνολικό αριθμό των αντικειμένων (pixels) καταταγμένο σε αυτή τη κατηγορία, σχετίζεται με τα λάθη της commission. Η ακρίβεια χρηστών και το k στατιστικό των εξαγόμενων κτιρίων μετά τον co-occurrence πίνακα βασισμένο στο φιλτράρισμα είναι σημαντικά υψηλότερο από πρίν σε όλες τις εξεταζόμενες περιοχές. Μετά τη βελτίωση του co-occurrence πίνακα, η μέση ακρίβεια χρηστών των τριών περιοχών αυξάνεται από 59% σε 86% και η μέση τιμή κ αυξάνεται από 0,54 σε 0,85 βελτιώνοντας και τις δύο μετρήσεις ακρίβειας αντίστοιχα. Τα αποτελέσματα της 1ης περιοχής είναι καλύτερα από της 2ης , αφού η 2η έχει αναλογικά τα περισσότερα μη οικοδομήσιμα κτίρια. Τα αποτελέσματα της 3ης περιοχής ήταν τα καλύτερα διότι τα μεγάλα κτίρια είχαν διαφορετικά υλικά στεγών από αυτές των μικρών με τις σκοτεινές στέγες. Κατά συνέπεια, είχαν διαφορετικά φασματικά χαρακτηριστικά επομένως ήταν και πιο ευδιάκρτιτα. Η βελτίωση ακρίβειας μέσω του κανονικού φιλτραρίσματος ανάλυσης σύστασης με την ομοιογένεια μέτρου σύστασης αξιολογήθηκε στην πρώτη εικόνα προκειμένου να το συγκρίνει με τον πίνακα co-occurrence βασισμένο στο φιλτράρισμα. Η μέθοδος αξιολόγησης ήταν όπως παραπάνω και τα αποτελέσματα ακρίβειας παρουσιάζονται στον πίνακα 1. η ακρίβεια χρηστών που αυξάνεται από 49% σε 69% με το κανονικό φιλτράρισμα ανάλυσης σύστασης και σε 86% με τον πίνακα co-occurrence βασισμένο στο φιλτράρισμα, δηλαδή της βελτίωσης ακρίβειας της τελευταίας μεθόδου έναντι της πρώτης κατά 25%.
Συμπεράσματα
Είναι προφανές ότι η ακρίβεια της ανίχνευσης κτιρίων σε δορυφορικές εικόνες δεν είναι ιδιαίτερα ικανοποιητική για λεπτομερή έρευνα της αστικής περιοχής η για τις εφαρμογές μεγάλης κλίμακας των GIS. Παρόλα αυτά, το αποτέλεσμα αυτής της μελέτης είναι πού χρήσιμο για μια γρήγορη εκτίμηση των αστικών κτισμάτων και της ανάπτυξης των πόλεων
http://www.sciencedirect.com/science?_ob=MImg&_imagekey=B6VF4-3W4XJ1F-5-H&_cdi=6000&_user=83473&_pii=S0924271698000276&_origin=search&_zone=rslt_list_item&_coverDate=02%2F28%2F1999&_sk=999459998&wchp=dGLzVlz-zSkWb&md5=cb172db6ff6d255a5119e0813c601a59&ie=/sdarticle.pdf