ΕΚΤΙΜΗΣΗ ΤΗΣ ΕΔΑΦΙΚΗΣ ΥΓΡΑΣΙΑΣ ΜΕ ΤΗΛΕΠΙΣΚΟΠΙΣΗ: ΜΙΑ ΤΕΧΝΙΚΗ ΜΕΘΟΔΟΣ ΕΚΜΑΘΗΣΗΣ
Από RemoteSensing Wiki
ΕΚΤΙΜΗΣΗ ΤΗΣ ΕΔΑΦΙΚΗΣ ΥΓΡΑΣΙΑΣ ΜΕ ΤΗΛΕΠΙΣΚΟΠΙΣΗ: ΜΙΑ ΤΕΧΝΙΚΗ ΜΕΘΟΔΟΣ ΕΚΜΑΘΗΣΗΣ
Πρωτότυπος τίτλος: Estimating soil moisture using remote sensing data: A machine learning approach
Συγγραφείς: Sajjad Ahmad, Ajay Kalra, Haroon Stephen
Πηγή: https://www.sciencedirect.com/science/article/pii/S0309170809001705 | Science Direct
Υπολογίζεται για 2 άρθρα.
Περίληψη:
η εδαφική υγρασία αποτελεί έναν παράγοντα υψίστης σημασίας για την υδρολογία. Ένα καινοτόμο πρόγραμμα παλινδρόμησης και πρόβλεψης της εδαφικής υγρασίας το SVM χρησιμοποιεί δεδομένα τηλεπισκόπησης και παρουσιάζεται στο άρθρο αυτό. Το μοντέλο αυτό βασίζεται σε στατιστικά δεδομένα και στη θεωρία των γραμμικών συναρτήσεων σύμφωνα με τον Kernel. Το μοντέλο αυτό στοχεύει στην ελαχιστοποίηση λαθών των εμπειρικών ταξινομήσεων και αυξάνοντας τις γεωμετρικές συγχωνεύσεις ενώ εφαρμόστηκε σε 10 περιοχές της λεκάνης απορροής του ποταμού στο Κολοράντο. Τα δεδομένα που αντλήθηκαν για τον υπολογισμό της εδαφικής υγρασίας ήταν κυρίως από Tropical Rainfall Measuring Mission (TRMM) και το NDVI το οποίο προήλθε από υψηλής ανάλυσης δεδομένα. Η προσομοίωση των υπολογισμών της εδαφικής υγρασίας μέσα στο χρόνο έγιναν για τα έτη 1998-2005 και ακολουθήθηκαν δύο μοντέλα. Το 1ο μοντέλο μελέτησε 6 τοποθεσίες και στο κάθε ένα εφαρμόστηκε ξεχωριστά το SVM. Το 2ο μοντέλο διαχωρίζεται σε 2 τμήματα: α) τα δεδομένα από όλες τις 6 τοποθεσίες συνδυάζονται και παράγεται ένα μόνο μοντέλο SVM για τις ίδιες τοποθεσίες και β) αναπτύσσοντας ένα μοντέλο βασισμένο στα δεδομένα από τις 6 τοποθεσίες χρησιμοποιείται αποκλειστικά για 4 μόνο τοποθεσίες. Μετά από στατιστικό έλεγχο φαίνεται πως και τα δύο μοντέλα είναι ικανοποιητικά αλλά το μοντέλο 2 και στις 2 περιπτώσεις του δίνει μικρότερα σφάλματα.
Εισαγωγή:
Η εδαφική υγρασία είναι ιδιαίτερα σημαντική τόσο για τον υδρολογικό κύκλο όσο και για το σχεδιασμό υδρολογικών μοντέλων ενώ ταυτόχρονα το «ιστορικό» της εδαφικής υγρασίας μπορεί να προσφέρει μεγάλο όγκο πληροφορίες για τη γενικότερη κατάσταση μιας περιοχής. Η μεγάλη ξηρασία το 2000 στη λεκάνη απορροής του Κολοράντο υπήρξε η μεγαλύτερη της περιοχής αυτής μέχρι σήμερα και τα σημάδια του φαινομένου έχουν άμεση σχέση με της κατάσταση της εδαφικής υγρασίας χρονικά αλλά και χωρικά. Οι ραδιοσυχνότητες ανιχνεύουν τις διηλεκτρικές σταθερές (και του νερού) και αποτελούν μεγάλη βοήθεια στη μελέτη της εδαφικής υγρασίας μέσω της τηλεπισκόπισης. Η NASA το 2012 σκοπεύει να ξεκινήσει έρευνα αφιερωμένη σε αυτό και καλείται Soil Moisture Active Passive (SMAP), αντίστοιχα έπραξε και η Ευρώπη το 2009 με το πρόγραμμα Soil Moisture and Ocean Salinity (SMOS) με τη χρήση μικροκυμάτων. Πολλές θεωρητικές και εμπειρικές μέθοδοι υπολογίζουν ικανοποιητικά την εδαφική υγρασία όμως πρέπει να συγκρίνονται με τα εργαστηριακά δεδομένα και μετρήσεις. Ακόμη, πιο δύσκολη είναι οι σύγκριση δεδομένων ραδιοσυχνοτήτων που δεν απεικονίζουν απόλυτα την υγρασία και τη βλάστηση. Μοντέλα τεχνητής νοημοσύνης (ANN) μιμούνται τον ανθρώπινο τρόπο εκμάθησης και είναι ικανά να δώσουν αποτελέσματα μέσα από μεγάλο όγκο δεδομένων, γραμμικές σχέσεις και συσχετίσεις δεδομένων εισόδου και εξόδου και επιλέγονται στην υδρολογία. Το SVM βασίζεται στο πρότυπο Kernel και σε άλλα στατιστικά στοιχεία προκειμένου να αποδοθούν και να συνδυαστούν με την τηλεπισκόπιση. Έτσι, αποτέλεσε εργαλείο για του ερευνητές και εφαρμόστηκε σε πολλούς τομείς υδρολογία, μετεωρολογία κλπ. Με τα μοντέλα που αναφέρθηκαν ανακτλήθηκαν δεδομένα και σε συνδυασμό με τη μεταβλητή χωρητικότητα διήθησης Variable Infiltration Capacity εκτιμήθηκε για τα επιλεγμένα σημεία στην κοιλάδα του ποταμού η εδαφική υγρασία και συγκρίθηκαν με τα πειραματικά δεδομένα της πειραματικής κοιλάδας Walnut Gulch στο LCRB.
Υποστηρικτικά μηχανήματα:
Τα μοντέλα αυτά SVM, δημιουργήθηκαν το 90 από τον Vapnik και τους συνεργάτες του για της ανάγκες της ταξινόμησης. Έπειτα επεκτάθηκε και στις ανάγκες της παλινδρόμησης με μερικές αλλαγές και βελτιώσεις σύμφωνα με του όρους Vapnik–Chervonenkis (VC). Για να αποδοθεί σωστά η ικανότητα εκπαίδευσης των μοντέλων εισήγαγαν κάποιες σταθερές και το μοντέλο βασίστηκε στο kernel και στο θεώρημα του Mercer. Βάση όλου του εγχειρήματος είναι η βελτιστοποίηση σύμφωνα με τη θεωρία της στατιστικής. Μετά τις στατιστικές εφαρμογές και την ρύθμιση και κανονικοποίηση των εξαρτημένων και ανεξάρτητων τιμών καθώς και διανυσμάτων προέκυψαν οι εξισώσεις (1) που φαίνονται στην εικόνα 1, όπου, ε: είναι ο μη-ευαίσθητος παράγοντας απωλειών του Vapnik, C: είναι ο παράγοντας κόστους και ξi και ξi* είναι οι λοιπές μεταβλητές.
Με διάφορες δοκιμές που έγιναν για να εξελιχθεί ακόμη περισσότερη η βελτιστοποίηση στο μοντέλο, τελικά τα SVM μπορούν να υπολογίσουν σημεία διανυσμάτων δύο διαστάσεων και για αυτό χρησιμοποιούνται για την επίλυση μη γραμμικών προσεγγίσεων. Συνοψίζοντας τα SVM ακολουθούν 3 βήματα: 1) την επιλογή της σωστής εξίσωσης του Kernel, 2) τον προσδιορισμό της παραμέτρου ε και 3) τον ακριβή προσδιορισμό της παραμέτρου C.
Περιοχή μελέτης:
Η λεκάνης απορρόης του ποταμού στο Κολοράντο παρέχει νερό, ελέγχονται οι πλημμύρες και υδροηλεκτρική ενέργειας σε ένα μεγάλο κομμάτι των νοτιοδυτικών Ηνωμένων Πολιτειών. Η λεκάνη απορροής περιλαμβάνει μέρη από 7 πολιτείες: Γουαϊόμινγκ, Κολοράντο, Γιούτα, Νέο Μεξικό, Νεβάδα, Αριζόνα και Καλιφόρνια. Είναι μια ημίξηρη περιοχή με ανάμεικτη μορφή βλάστησης και μεγάλες γυμνές εδάφους.
Στην εικόνα 2 (Fig.2) Η σκοτεινή περιοχή στην ανατολική κεντρική λεκάνη απορροής (LCRB) ίναι το δάσος Coconino κατά μήκος της κορυφογραμμής Mogollon και οι φωτεινότερες περιοχές της εικόνας αντιστοιχούν στην έρημο και τη χαμηλή βλάστηση. Φαίνεται και ο κανονικοποιημένος δείκτης βλάστησης (NDVI). Στην εικόνα φαίνονται και οι 6 περιοχές που επιλεχθηκαν για τη μελέτη.
Δεδομένα: Τα διαστημικά δεδομένα τηλεπισκόπησης επιλέχθηκαν από το πρόγραμμα Μέτρησης Τροπικών Βροχοπτώσεων Tropical Rainfall Measuring Mission (TRMM) και από τον Εξελιγμένο υψηλής ανάλυσης ραδιομετρητή Advanced Very High Resolution Radiometer (AVHRR).
Το μοντέλο TRMM χρησιμοποιήθηκε κυρίως για την εκτίμηση και κατανόηση της βρόχοπτωση και τη σχέση της με τον υδρολογικό κύκλο. Το TRMM πολλές φορές εκμεταλέυεται τις ιδιότητες του ραντάρ και έτσι δημιουργείται το θυγατρικό μοντέλο TRMMPR. Από τη χρήση των μοντέλων αυτών παρατηρήθηκε πως στα κανάλια C και L, HH πόλωση είναι πιο ευαίσθητη στην εδαφική υγρασία σε σχέση με την VV πόλωση. Πρέπει να τονισθεί πως τα δεδομένα μπορούν να αντληθούν την επόμενη μέρα για αυτό χρησιμοποιείται για μετρήσεις μικρού χρονικού εύρους.
Ο κανονικοποιημένος δείκτης βλάστησης διαφοράς (NDVI) χρησιμοποιείται για να ερευνηθεί η κάλυψη γης από τη βάστηση και προσδιορίζεται με την ακόλουθη σχέση, όπου NIR και RED είναι το εγγύς υπέρυθρο και το κόκκινο αντίστοιχα.
Εδαφική υγρασία:
Στην μελετη αυτή χρησιμοποιήθηκε το μοντέλο VIC, ένα μοντέλο για ισοζύγιο νερού και ενέργειας μικρής κλίμακας και απαιτεί δεδομένα εδαφολογικά, μετεωρολογικά, βλάστησης για να εκτιμήσει την επιφανειακή απορροή. Από το VIC τα δεδομένα λαμβάνονταν σε καθημερινή βάση. Η εδαφική υγρασία μετριόταν στα πρώτα 5 εκ εδάφους στον πειραματικό χώρο WGEW.
Μέθοδοι:
Ο κύριος στόχος της μελέτης αυτής είναι ο υπολογισμός της εδαφικής υγρασίας στην λεκάνη απορροής του ποταμού του Κολοράντο με τη χρήση της τηλεπισκόπησης στα επιλεγμένα σημεία της ευρύτερης επριοχής. Για να επιτευχθεί αυτό, η μεθοδολογία βασίστηκε στο SVM μοντέλο κατά kernel αξιολογόντες δείκτες όπως η γωνία πρόσπτωσης, NDVI κλπ. Το διαφορετικό μοντέλο VIC χρησιμοποιεήθεικε με σκοπό να ελέγχει τη λειτουργικότητα του SVM.
Το SVM διαχωρίζει την ανάλυση δεδομένων σε 2 μέρη, το δοκιμαστικό και του ελέγχου. Το πρώτο μέρος, το δοκιμαστικό είναι και το μεγαλύτερο συνήθως. Στο σημείο αυτό υπολογίζονται μεταβληττές, δείκτες και σταθερές από το VIC, που αναφερθηκαν και νωρίτερα. Τις περισσότερες φορές όσο μεγαλύτερο είναι το δοκιμαστικό κομμάτι τόσο πιο βελτιωμένη η γενίκευση των σχέσεων όλων των προαναφερθέντων. Το μοντέλο SVM διαχωρίζεται σε 2 διαφορετικά μοντέλα, όπου στο πρώτο τα δεδομένα για κάθε μια από τις 6 περιοχές που επιλέχθηκαν δημιουργήθηκαν και τα αντίστοιχα «ατομικά» μοντέλα, ενώ στο δεύτερο χρησιμποιόντας αυτά του του πρώτου τα μικρότερα 6 διαφορετικά μοντέλα συνδυάζονται. Για την εξαγωγή των δεδομένων χρησιμοποιήθηκαν ποικίλοι μέθοδοι και πολλές στατιστικές θεωρίες προσαρμοσμένες τις περισσότερες φορές για την πρόβλεψη της υγρασίας και την υδρολογία γενικότερα. Τέλος, για την εξαγωγή των αποτελεσμάτων και των συμπερασμάτων συνδυάστηκαν μοντέλα όπως το VIC, το Artificial Neural Network (ANN) και το Mutivariate Linear Regrassion model (MLRM) τα οποία βοήθησαν στην δοκιμή και τον έλεγχο των δεδομένων.
Αποτελέσματα:
Αρχικά το μοντέλο SVM δοκιμάστηκε για τα έτη 1998–2002 και ελέγχηθε για τα 2003-2005 σύμφωνα με τα δεδομένα από το VIC. Τελικά έπειτα από κάποιες ακόμη δοκιμές του SVM, συγκρίθηκαν τα υπολογισμένα δεδομένα του VIC με αυτά των ANN και MLRM.
Στα διαγράμματα 3 και 4 φαίνονται τα αποτελέσματα για κάθε ένα από τα 6 σημεία για το πρώτο μοντέλο. Παρατηρείται ότι στο διάγραμμα 3 στο έκτο σημείο οι χαμηλές τιμές της εδαφικής υγρασίας δεν μπορούν να απεικονιστούν.
Στο διάγραμμα 4, απεικονίζεται για τα σημεία αυτά η εδαφική υγρασία κατά τη διάρκεια του ελέγχου στο μοντέλο SVM 1. Όπως και στην προηγούμενη κατάσταση το ίδιο και εδώ στο σημείο 6 ειναια δύνατη η εκτίμηση των χαμηλών τιμώ της εδαφικής υγρασία λόγω της μεγαλης πυκνότητας της βλάστησης. Η αδυναμία του SVM να εκτιμήσει της χαμηλές τιμές της εδαφικές υγρασίας ενδέχεται να οφείλεται στο γεγονός ότι δίνει έμφαση σε οριακά σημεία (και υπερβάσεις) κατά τη δοκιμαστική περίοδο.
Σύφωνα με τα στατιστικά δεδομένα που παράχθηκαν από το SVM φαίνεται πως η εδαφική υγρασία που υπολογίστηκε με το VIC έχει RMSE κάτω από 2% και MAE κάτω από 1.50%, όπως παρουσιάζονται και στον πίνακα 1 (Table 1). Παρατηρείται επίσης πως το σημείο 2 έχει τις καλύτερες μετρήσεις και το 6 τις χειρότερες.
Στο διάγραμμα 5 απεικονίζονται τα πιθανά λάθη των μετρήσεων που έγιναν και αγγίζουν το 5% και κάτω. Το μοντέλο υπολογισμών 2 Α χρησιμοποιεί δεδομένα από το προηγούμενο μοντέλο και στο Διάγραμμα 6 φαίνεται η σύγκριση των τιμών τηε εδαφικής υγρασίας του VIC και των τιμών SM (της εδαφικής υγρασίας) κατά την περίοδο ελέγχου. Από το διάγραμμα φείνεται ότι το μοντέλο έχει ιδιαίτερα ικανοποιητικές εκτιμησείς της εδαφικής υγρασίας σε υψηλές τιμές και πολύ κακές στις χαμηλές. Αυτό μπορεί να οφείλεται στην πυκνότητα της βλάστησης στην περιοχή. Μαζι φαίνονται και τα στατιστικά αποτελέσματα του μοντέλου.
Για την αξιολόγηση της αποτελεσματικότητας του SVM, χρησιμοποιήθηκε ένα ακόμη μοντέλο, το μοντέλο 2Β, για τις υπόλοιπες 4 περιοχές που επέμειναν. Τα αποτελέσματα αυτού εμφανίζονται ως πιθανά σφάλματα στο διάγραμμα 7. Φαίνεται πως τα μικρότερα σφάλματα εκτίμησης είχαν τα πρώτα 2 σημεία από τα 4 (7 και 8) και τα άλλα (9 και 10) ήταν μεγαλύτερα. Γενικά, το SVM εκτιμά αρκετά ικανοποιητικά την εδαφική υγρασία και το μέγεθος του σφάλματος φτάνει το ποσοστό 15-20% στο ποσοστώ του 60-80% των εκτιμήσεων. Τελικά, από το 2Β τα καλύτερα αποτελέσματα έδωσε το σημείο 8 και τα χειρότερα το 9.
Τα δεδομένα αυτά συγκρίνονται με αυτά που εκτιμήθηκαν για το βάθος των 5εκ. Οι εκτιμήσεις της εδαφικής υγρασίας για την περίοδο ελέγχου από το SVM φαίνονται στο διάγραμμα 8Α. Τα σημεία που βρίσκονται μακρία από την κεντρική γραμμή είναι είτε πολύ μικρές έιτε πολύ υψηλές τιμές. Στο πλαίσιο απεικονίζοναι ο διάμεσος και τα εκατομηριοστά του συνόλου των δεδομένου της περιόδου ελέγχου (δοκιμής) τόσο για τις μετρήσεις όσο και για τις προσομοιώσεις(Διάγραμμα 8D). Η κουκίδα στη μέση απεικονίζει το μέσο όρο των εκτιμώμενων δεδομένων.
Σύμφωνα με τα αποτελέσματα από την εκτίμηση της εδαφικής υγρασίας μέσω VIC και πειραματικά φαίνεται ότι η μέθοδος SVM έχει αρκετά καλά αποτελέσματα βασιζόμενη στην τηλεπισκόπηση. Από το πρώτο μοντέλο SVM φαίνεται ότι η μέθοδος μαθαίνει και από τα 6 σημεία και οι προσομοιώσεις είναι πολύ καλές, από το μοντέλο 2Α τα αποτελέσματα είναι απολυτως λογικά και στο μοντέλο 2Β τα δεδομένα δεν είναι τόσο αξιόπιστα και καλά για τα 4 σημεία που μελετά αλλά μπορούν να φανούν χρήσιμα.
Σύγκριση του SVM με το ANN και το MLR: Τα αποτελέσματα του ANN και του MLR απεικονίζονται στα διαγράμματα 9 και 10 αντίστοιχα. Και τα δύο αυτά μοντέλο δίνουν πιο ποιοτικά αποτελέσματα από το SVM. Επίσης και τα δύο δίνουν καλά αποτελέσματα για τη θέση 1 ενώ λιγότερο ορθά για την θέση 5 όσον αφορά το ANN και τη θέση 6 όσον αφορά το MLR. Παράλληλα και τα 3 αυτά μοντέλα παρουσιάζουν μια αδυναμία αξιοπιστίας στις τοποθεσίες με πυκνή βλάστηση. Ακόμη, στατιστικά μπορούν τα μοντέλα να συγκριθούν αν παρατηρηθεί ο πίνακας 1 που δίνει τα στατιστικά τους αποτελέσματα συγκεντρωτικά. Τέλος, το ANN πιθανότατα να εμφανίζει μια αδυναμία αξιοπιστίας για τα οριακά δεδομένα μιας περιοχής σε σχέση με το MLR, το οποίο δεν αντιμετωπίζει αντίστοιχο πρόβλημα στην εξαγωγή αποτελεσμάτων.Και φυσικά, η μεγαλύτερη αδυναμία και των τριών αυτών μοντέλων βρίσκεται στην ανικανότητα εξαγωγής καλών αποτελεσμάτων και σωστής εκτίμησης της εδαφικής υγρασίας στις ακραίες τιμές (υψηλές ή χαμηλές).
Συμπεράσματα:
Προκειμένου να υπολογιστεί η εδαφική υγρασία με τη βοήθεια τηλεπισκοπικών δεδομένων χρησομοποιήθηκαν ως εργαλεία το TRMMPR που έχεις ως βάση του το ραντάρ για τον εντοπισμό των διηλεκτρικών χαρακτηριστικών του νερού. Πάνω στο εργαλείο αυτό διαμορφώθηκαν μοντέλα προσομοίωσης και πρόβλεψης της εδαφικής υγρασίας τα οποία περιείχαν στατιστικές αρχές αναάλυσης δεδομένων. Τα μοντέλα αυτά είναι το SVM, ANN και MLR. Τα αποτελέσματα των μοντέλων προήλθαν είτε από δοκιμαστικές χρονικές περιόδους είτε από χρονικές περιόδους ελέγχου και σε γενικές γραμμές και τα τρία έδωσαν αρκετά αξίοπιστα αποτελέσματα. Δυσκολεύονται τα μοντέλα αυτά να αποδώσουν σε περιοχές με πολύ μικρη πυκνότητα βλάστησης ενώ σε περιοχές με πυκνή βλάστηση τα αποτελέσματα είναι πολύ καλύτερα. Για το λόγω αυτό αξιοποιήθηκαν και οι ιδιότητες του TRMMPR αλλά και το NDVI (δεδομένα τηλεπισκόπησης). Τελικά, το βασικό μοντέλο SVM μπορεί να χρησιμοποιήθεί ως μια εναλλακτική λύση αντί της χρήσης ακριβών μεθόδων και δεδομένων. Μπορεί να χρησιμοποιηθεί για πολλούς τομείς της υδρολογίας, τη μετεωρολογία κλπ, πρέπε όμως να τονιστεί πως στη μελε΄τη αυτή γεωγραφικοί παράγοντες και η τοπογραφία δεν λήφθηκαν υπόψη. Η εκτίμηση της εδαφικής υγρασίας είναι πολύ κρίσιμη και σημαντική στον τομέα της γεωργίας καθώς μπορεί η άρδευση και η διαχείριση του αρδευτικού νερού να βελιτιστοποιηθεί.