Αξιολόγηση υψηλής ανάλυσης δορυφορικών εικόνων SPOT 5 για την ταυτοποίηση καλλιεργειών
Από RemoteSensing Wiki
Αξιολόγηση υψηλής ανάλυσης δορυφορικών εικόνων SPOT 5 για την ταυτοποίηση καλλιεργειών
Evaluating high resolution SPOT 5 satellite imagery for crop identification
Chenghai Yang, James H. Everitt, Dale Murden, Computers and Electronics in Agriculture, Volume 75, Issue 2, February 2011, Pages 347-354 , Published by Elsevier B.V.
[5]
Περίληψη
Μια εικόνα SPOT 5[6] που αποκτήθηκε τον Μάιο του 2006 με 4 φασματικά κανάλια (πράσινο, κόκκινο, εγγύς υπέρυθρο και βραχέων κυμάτων υπέρυθρο) και με μέγεθος pixel 10-m που κάλυπτε τις εντατικά καλλιεργημένες περιοχές στο νότιο Τέξας, αξιολογήθηκε για την ταυτοποίηση των καλλιεργειών. Δυο εικόνες υποσυνόλων που καλύπτουν μια ποικιλία καλλιεργειών με διαφορετικά στάδια ανάπτυξης, εξήχθησαν από τη δορυφορική εικόνα και 5 τεχνικές επιβλεπόμενης ταξινόμησης, συμπεριλαμβανομένης της Ελάχιστης Απόστασης, της απόστασης Mahalanobis, της Μεγίστης Πιθανοφάνειας (ML), της SAM και της SVM , εφαρμόστηκαν στις 10-m εικόνες υποσυνόλων και σε δυο χονδροειδούς ανάλυσης εικόνες, για να προσδιορίσουν τους τύπους καλλιεργειών. Η ανάλυση Kappa έδειξε ότι ο ML και ο SVM εκτελέστηκαν καλύτερα από τους άλλους τρεις ταξινομητές. Η εκτίμηση της ακρίβειας έδειξε ότι οι 10-m, 4-καναλιών εικόνες βασισμένες στην Μεγίστη Πιθανοφάνεια είχαν ως αποτέλεσμα τις καλύτερες τιμές συνολικής ακρίβειας του 91% και 87% για τις δυο περιοχές, αντίστοιχα. Η συμπερίληψη του SWIR καναλιού στατιστικά αύξησε σημαντικά τη συνολική ακρίβεια από 82% σε 91% για την περιοχή 1 και από 75% σε 87% για την περιοχή 2. Έτσι, οι πολυφασματικές εικόνες SPOT 5 σε συνδυασμό με τις τεχνικές ταξινόμησης ML και SVM μπορούν να χρησιμοποιηθούν για τον προσδιορισμό των καλλιεργειών.
Εισαγωγή
Οι δορυφορικές εικόνες, λόγω της συνοπτικής επισκόπησης και της επαναλαμβανόμενης μεγάλης κάλυψης, χρησιμοποιούνται συχνά για την αναγνώριση καλλιεργειών. Η βάση για το διαχωρισμό μιας καλλιέργειας από μια άλλη είναι η προϋπόθεση ότι το κάθε είδος καλλιέργειας έχει μια μοναδική εμφάνιση ή φασματική υπογραφή[7] στην εικόνα. Σημαντικοί περιορισμοί όσον αφορά την ταυτοποίηση των καλλιεργειών με δορυφορικές εικόνες, σχετίζονται με την ομοιότητα της ανακλαστηκότητας των φυτών διαφορετικών καλλιεργειών. Οι εξελίξεις στην ψηφιακή επεξεργασία εικόνας και στα ΓΣΠ[8] έχουν αυξήσει τις δυνατότητες για την εξαγωγή ακριβέστερων πληροφοριών για τις καλλιέργειες από δορυφορικές εικόνες. Πιο πρόσφατα, εικόνες από υψηλής χωρικής ανάλυσης δορυφορικά συστήματα όπως ο SPOT 5 έχουν γίνει διαθέσιμες. Οι υψηλής ανάλυσης δορυφορικές εικόνες προσφέρουν νέες δυνατότητες για ενδεχομένως πιο ακριβή αναγνώριση και εκτίμηση εκτάσεων γεωργικών καλλιεργειών σε σχέση με τις παραδοσιακές δορυφορικές εικόνες. Οι στόχοι αυτής της μελέτης ήταν οι εξής: (1) η αξιολόγηση ενιαίας-ημερομηνίας πολυφασματικών εικόνων SPOT 5 για την αναγνώριση καλλιεργειών σε δυο εντατικά καλλιεργημένες περιοχές στο νότιο Τέξας χρησιμοποιώντας 5 επιβλεπόμενες τεχνικές ταξινόμησης, αυτές της Ελάχιστης Απόστασης, της απόστασης Mahalanobis, της ML, της SAM και της SVM. (2) η σύγκριση των ακριβειών ταξινόμησης σε τρία διαφορετικά μεγέθη pixel (αρχικό 10m και προσομοιωμένα 20m και 30m) και (3) η εξέταση της επίδρασης του SWIR καναλιού στα αποτελέσματα της ταξινόμησης.
Περιοχή Μελέτης - Μέθοδοι
Μια πολυφασματική SPOT 5 εικόνα που καλύπτει μια περιοχή 60x60km στην κοιλάδα Rio Grande[9] του νότιου Τέξας αποκτήθηκε στις 19 Μαΐου του 2006. Η χωρική ανάλυση ήταν 10m για το πράσινο, κόκκινο και NIR κανάλι και 20m για το κανάλι SWIR. Δυο εντατικά καλλιεργημένες περιοχές που καλύπτονται από τη δορυφορική εικόνα επιλέχθηκαν ως οι περιοχές μελέτης. Η μια περιοχή βρίσκεται κοντά στο Alamo, Τέξας καλύπτοντας11,2x8,5km και η άλλη βρίσκεται κοντά στην Elsa, Τέξας, καλύπτοντας 12,2x8,5km . Στην καλλιεργητική περίοδο 2006, 4 κύριες καλλιέργειες δηλαδή το καλαμπόκι, το βαμβάκι, το σόργο[10], και το ζαχαροκάλαμο καλλιεργούνται στις περιοχές μελέτης. Όταν αποκτήθηκαν οι εικόνες όλες οι καλλιέργειες είχαν φτάσει ή πλησίαζαν την μέγιστη ανάπτυξη τους στις περισσότερες περιοχές, αν και υπήρχαν περιοχές με καλλιέργειες στα πρώτα στάδια ανάπτυξής τους. Πριν την παράδοση, οι εικόνες διορθώθηκαν ραδιομετρικά και γεωγραφικά. Οι πριν τη διόρθωση πρότυπες εικόνες είχαν μια ακρίβεια θέσης 30m. Ως εκ τούτου, οι εικόνες διορθώθηκαν χρησιμοποιώντας 97 σημεία επίγειου ελέγχου. Η διόρθωση εκτελέστηκε χρησιμοποιώντας έναν πρώτης τάξης πολυωνυμικό μετασχηματισμό και την τεχνική δειγματοληψίας του Εγγύτερου Γείτονα. Το RMS σφάλμα των εικόνων ήταν 2,5m. Και οι δυο περιοχές είχαν παρόμοιες τάξεις κάλυψης καλλιεργειών και μη-καλλιεργειών. Ως τάξεις καλλιεργειών τέθηκαν το καλαμπόκι, το βαμβάκι, το σόργο, και το ζαχαροκάλαμο, ενώ οι τάξεις μη-καλλιέργειας χωρίστηκαν σε 5 κατηγορίες: χόρτα (ζωοτροφή), μικτά ποώδη είδη, μικτά ξυλώδη είδη, χέρσα και νερό. Πέντε επιβλεπόμενοι ταξινομητές, ο Ελαχίστης Απόστασης, η απόσταση Mahalanobis, ο ML, ο SAM και ο SVM εφαρμόστηκαν αρχικά στις εικόνες 4-καναλιών και μετά σε αυτές των 3-καναλιών (χωρίς το SWIR) στα τρία μεγέθη pixel. Ο ταξινομητής της ελάχιστης απόστασης χρησιμοποιεί τα μέσα της τάξης που προέρχονται από τα δεδομένα εκπαίδευσης και κατατάσσει κάθε pixel στη τάξη που έχει την πιο κοντινή Ευκλείδεια απόσταση από το pixel. Η μέθοδος της απόστασης Μahalanobis είναι παρόμοια με της ελάχιστης απόστασης, εκτός από το ότι ο πίνακας συνδιασποράς χρησιμοποιείται στον υπολογισμό. Κάθε pixel κατατάσσεται στην τάξη για την οποία η απόσταση Mahalanobis είναι η μικρότερη. Η ML ταξινόμηση προϋποθέτει ότι τα στοιχεία για την κάθε τάξη στο κάθε κανάλι είναι κανονικά κατανεμημένα και υπολογίζει την πιθανότητα ότι ένα δεδομένο pixel ανήκει σε μια συγκεκριμένη τάξη. Κάθε pixel ανατίθεται στη τάξη που έχει την μεγαλύτερη πιθανότητα. Ο ταξινομητής SAM κατατάσσει τα pixels στις τάξεις, με βάση τις ελάχιστες φασματικές γωνίες, ενώ ο ταξινομητής SVM είναι μια τεχνική μηχανικής εκμάθησης που βασίζεται στον πυρήνα που διαχωρίζει τις τάξεις με μια επιφάνεια απόφασης που μεγιστοποιεί το περιθώριο μεταξύ των τάξεων. Οι εικόνες 4-καναλιών, 10-m και ο ταξινομητής ML χρησιμοποιήθηκαν σε αυτή την ανάλυση και 6 χάρτες ταξινόμησης δημιουργήθηκαν. Τα στατιστικά ακρίβειας της ταξινόμησης συμπεριλαμβανομένης της συνολικής ακρίβειας, της ακρίβειας παραγωγού, της ακρίβειας χρήστη και των συντελεστών Kappa, υπολογίστηκαν με βάση τους πίνακες σφάλματος. Η ανάλυση Kappa πραγματοποιήθηκε επίσης, για να ελέγξει αν η κάθε ταξινόμηση ήταν σημαντικά καλύτερη από μια τυχαία ταξινόμηση και αν τυχόν δυο ταξινομήσεις ήταν σημαντικά διαφορετικές. Η τιμή Kappa 0 αντιστοιχεί σε μια συνολικά τυχαία ταξινόμηση, ενώ η τιμή kappa 1 αντιπροσωπεύει μια τέλεια συμφωνία μεταξύ της ταξινόμησης και των στοιχείων αναφοράς. Το στατιστικό αποτέλεσμα της δοκιμής για τον έλεγχο της διαφοράς μεταξύ οποιωνδήποτε δυο ταξινομήσεων ήταν μια τυποποιημένη Ζ-τιμή, καθορισμένη από τη διαφορά μεταξύ των τιμών kappa και του αθροίσματος των διαφορών kappa για τις δυο ταξινομήσεις.
Αποτελέσματα
Τα σύνθετα CIR που εξάγονται από την 10-m SPOT 5 δορυφορική εικόνα για τις δυο περιοχές μελέτης, αποκαλύπτουν τις ευδιάκριτες διαφορές ανάμεσα στις καλλιέργειες και σε άλλους τύπους κάλυψης στις δυο περιοχές (εικόνα 1). Στις εικόνες CIR, οι καλλιέργειες και η άλλη βλάστηση γενικά έχουν ένα κοκκινωπό χρώμα, το γυμνό έδαφος έχει ένα γκριζωπό και κυανό τόνο και το νερό έχει ένα σκούρο ή γαλαζωπό χρώμα. Ένας 5 τάξεων χάρτης ταξινόμησης που παράχθηκε από τις 4-καναλιών, 10m SPOT 5 εικόνες υποσυνόλων για τις δυο περιοχές, βασισμένος στον ταξινομητή ML, φαίνεται στην εικόνα 2. Οπτική σύγκριση με τις εικόνες CIR δείχνουν ότι οι χάρτες ταξινόμησης παρείχαν καλούς διαχωρισμούς μεταξύ των τάξεων καλλιέργειας και μη-καλλιέργειας. Εξαιτίας των διαφορετικών σταδίων ανάπτυξης και των συνθηκών διαχείρισης των καλλιεργειών, δεν ήταν οπτικά σαφές το πόσο καλά είχαν διαχωριστεί οι καλλιέργειες. Τα περισσότερα χωράφια στο χάρτη ταξινόμησης είχαν μόνο μια κυρίαρχη τάξη. Η σύνοψη των αποτελεσμάτων της αξιολόγησης της ακρίβειας για τους χάρτες ταξινόμησης που παρήχθησαν από τις δυο εικόνες βασισμένοι στους 5 ταξινομητές για τις περιοχές Alamo και Elsa παρουσιάζονται στους πίνακες 1 και 2, αντίστοιχα. Η συνολική ακρίβεια κυμάνθηκε από 72,2% για τον SAM έως 91,0% για τον ML, για την περιοχή Alamo και από 68,2% για τον SAM έως 87,4% , για την περιοχή μελέτης Elsa. Η συνολική τιμή kappa ποίκιλε από 0,622 ως 0,875 για την περιοχή Alamo και από 0,583 ως 0,835 για την περιοχή Elsa μεταξύ των 5 ταξινομητών. Αυτές οι τιμές kappa δείχνουν πόσο καλά τα αποτελέσματα της ταξινόμησης συμφωνούν με τα στοιχεία αναφοράς.
Πίνακας 1 : Αποτελέσματα τις αξιολόγησης της ακρίβειας για τους πέντε χάρτες ταξινόμησης που παράχθηκαν από την 10-m, 4-καναλιών SPOT 5 δορυφορική εικόνα υποσυνόλων για μια περιοχή καλλιεργειών κοντά στο Alamo, Τέξας (περιοχή 1).[11]πηγή]Πίνακας 2 : Αποτελέσματα τις αξιολόγησης της ακρίβειας για τους πέντε χάρτες ταξινόμησης που παράχθηκαν από την 10-m, 4-καναλιών SPOT 5 δορυφορική εικόνα υποσυνόλων για μια περιοχή καλλιεργειών κοντά στο Elsa, Τέξας (περιοχή 2).[12]πηγή]]
Όλες οι ταξινομήσεις ήταν σημαντικά καλύτερες από μια τυχαία ταξινόμηση σε επίπεδο εμπιστοσύνης 95%. Ο πίνακας 3 παρουσιάζει τις στατιστικές τιμές Ζ για την παραγωγή ανά ζεύγη συγκρίσεων ανάμεσα στις 5 ταξινομήσεις για τις δυο περιοχές. Για την περιοχή Alamo, ο ML και ο SVM ήταν σημαντικά καλύτεροι από τους άλλους τρεις ταξινομητές, αλλά δεν υπήρχε σημαντική διαφορά μεταξύ τους (91%vs 90.6%). Ο ταξινομητής MAHD ήταν σημαντικά καλύτερος από τον MD και τον SAM. Για την περιοχή Elsa και οι 5 ταξινομητές ήταν σημαντικά διαφορετικοί ο ένας από τον άλλον εκτός από το ότι δεν υπήρχε διαφορά μεταξύ του ML και του SVM (87,45 vs 86,4%). Ανάμεσα στους 5 ταξινομητές ο ML και ο SVM γενικά παρείχαν τις καλύτερες συνολικά ταξινομήσεις και ακολουθούν ο MAHD, o MD και ο SAM.
Ανάμεσα στους 5 ταξινομητές, ο ML και ο SVM γενικά παρείχαν την καλύτερη ακρίβεια παραγωγού και χρήστη. Η απόσταση Mahalanobis εκτελέστηκε συνολικά καλύτερα από τους άλλους δυο ταξινομητές στη διαφοροποίηση των 5 τάξεων. Οι πίνακες σφάλματος και τα μέτρα ακρίβειας για τους χάρτες της ML ταξινόμησης για τις περιοχές Alamo και Elsa δίνονται στους πίνακες 4 και 5, αντίστοιχα. Η ακρίβεια παραγωγού κυμάνθηκε από 84% έως 94% για την Alamo και από 80% έως 96% για την περιοχή Elsa, ενώ η ακρίβεια χρήστη κυμάνθηκε από 71% έως 98% για την περιοχή Alamo και από 70% έως 94% για την Elsa.
Πίνακας 5 : Ο πίνακας σφάλματος και τα μέτρα ακρίβειας για ένα χάρτη ταξινόμησης που παράχθηκε από την 10-m, 4-καναλιών SPOT 5 δορυφορική εικόνα υποσυνόλων για μια περιοχή καλλιεργειών κοντά στο Elsa, Τέξας (περιοχή 2), με βάση τον ταξινομητή Μεγίστης Πιθανοφάνειας.Συνολική ακρίβεια=87,4%. Συνολικό kappa=0,835. Στατιστικό-Ζ=43,44.[15]πηγή]]
Οι πέντε τάξεων χάρτες ταξινόμησης που παράχθηκαν από τις 20-m, 4-καναλιών SPOT 5 εικόνες υποσυνόλων για τις δυο περιοχές με βάση τον ταξινομητή ML, παρουσιάζονται στην εικόνα 3. Οι 20-m χάρτες ταξινόμησης είναι πολύ παρόμοιοι με αυτούς των 10-m, δείχνοντας ότι το μεγαλύτερο μέγεθος pixel δεν είχε σημαντική επίδραση στην ακρίβεια της ταξινόμησης. Οι πέντε τάξεων χάρτες ταξινόμησης που παράχθηκαν από τις 10-m, 3-καναλιών SPOT 5 εικόνες υποσυνόλων για τις δυο περιοχές με βάση τον ταξινομητή ML, δίνονται στην εικόνα 4. Οι χάρτες ταξινόμησης από τις 10-m, 3-καναλιών εικόνες φαίνονται κάπως πιο θορυβώδεις από αυτές των εικόνων 4-καναλιών, δείχνοντας ότι η συμπερίληψη του καναλιού SWIR μπορεί να έχει βελτιωμένα αποτελέσματα ταξινόμησης.
Δεν υπήρχαν σημαντικές διαφορές στη συνολική ακρίβεια μεταξύ των τριών μεγεθών pixel είτε για τον συνδυασμό 3-καναλιών είτε για τον συνδυασμό 4-καναλιών . Ωστόσο, η συνολική ακρίβεια ήταν σημαντικά υψηλότερη για τον συνδυασμό των 4 καναλιών. Αυτά τα αποτελέσματα συμφωνούν με τις οπτικές παρατηρήσεις που προέρχονται από τους χάρτες ταξινόμησης που φαίνονται στις εικόνες 2 - 4.
Η ML ήταν η καλύτερη για τα συνδυασμένα στοιχεία. Τα αποτελέσματα δείχνουν ότι είναι εφικτό να ταξινομηθεί μια μεγάλη εικόνα βασισμένη στα δείγματα εκπαίδευσης που εξάγονται από ολόκληρη την εικόνα. Για να βελτιωθεί η ακρίβεια της ταξινόμησης, μπορεί να είναι πιο αρμόζον να διαιρεθεί μια μεγάλη εικόνα σε πολλά μικρότερα υποσύνολα και να ταξινομηθούν οι εικόνες υποσυνόλων ξεχωριστά.
Συμπεράσματα
Τα συμπεράσματα που εξάγονται από τα αποτελέσματα αυτής της μελέτης είναι: Οι ενιαίας-ημερομηνίας SPOT 5 πολυφασματικές εικόνες μπορούν να χρησιμοποιηθούν για την ταυτοποίηση καλλιεργειών αν οι εικόνες λαμβάνονται κατά τη διάρκεια της βέλτιστης περιόδου διάκρισης καλλιεργειών για μια δεδομένη περιοχή. Ανάμεσα στους 5 ταξινομητές που εξετάστηκαν, ο ML και ο SVM είχαν καλύτερα αποτελέσματα από τους MD, MAHD και SAM. Η αύξηση του μεγέθους των pixel από 10-m σε 30-m δεν επηρέασε σημαντικά την ακρίβεια της ταξινόμησης. Τα δεδομένα υψηλής ανάλυσης μπορούν να χρησιμοποιηθούν για ακριβείς γεωργικές εφαρμογές εκτός από την αναγνώριση καλλιεργειών. Η συμπερίληψη του καναλιού SWIR στην πολυφασματική εικόνα SPOT 5 βελτίωσε σημαντικά τα αποτελέσματα της ταξινόμησης.