Προσδιορισμός αλπικών λιμνών στα Ανατολικά Ιμαλάια με χρήση deep learning
Από RemoteSensing Wiki
Πρότυπος Τίτλος
Προσδιορισμός αλπικών λιμνών στα Ανατολικά Ιμαλάια με χρήση deep learning
Τίτλος
Identifying Alpine Lakes in the Eastern Himalayas Using Deep Learning
Πηγή
Συγγραφείς Jinhao Xu, Min Feng, Yijie Sui, Dezhao Yan, Kuo Zhang, Kaidan Shi
Πίνακας περιεχομένων |
Εισαγωγή
Το κείμενο εξετάζει τη σημασία και τις προκλήσεις του εντοπισμού των αλπικών λιμνών, ιδίως των παγετωδών λιμνών, σε ορεινές περιοχές με τη χρήση δορυφορικών δεδομένων. Οι παγετώδεις λίμνες επηρεάζονται από την υποχώρηση των παγετώνων, δημιουργώντας κινδύνους, όπως οι πλημμύρες από έκρηξη παγετώδους λίμνης. Οι παραδοσιακές μέθοδοι, όπως οι δείκτες νερού, αντιμετωπίζουν σφάλματα λόγω του πολύπλοκου εδάφους και των καιρικών συνθηκών. Η εργασία προτείνει μια αυτοματοποιημένη μέθοδο που χρησιμοποιεί βαθιά μάθηση και δορυφορικά δεδομένα πολλαπλών πηγών για τον ακριβή εντοπισμό παγετωνικών λιμνών. Η προσέγγιση αυτή ενσωματώνει εικόνες πραγματικού χρώματος, δείκτες νερού, ραντάρ συνθετικού ανοίγματος (SAR) και ψηφιακά μοντέλα υψομέτρου (DEM).Η μέθοδος διακρίνει παγετώδεις και μη παγετώδεις λίμνες με βάση το περιβάλλον τους, χρησιμοποιώντας ένα σύνολο ετικετών βαθιάς μάθησης για τα Ανατολικά Ιμαλάια. Η δυνατότητα διάκρισης των τύπων λιμνών ενισχύει την κατανόηση των οικοσυστημάτων και βοηθά στην αξιολόγηση των πιθανών κινδύνων που σχετίζονται με αυτές τις λίμνες.
Περιοχή Μελέτης
Τα Ανατολικά Ιμαλάια παρουσιάζουν ποικίλες κλιματολογικές συνθήκες, με τη νότια περιοχή να επηρεάζεται από τους μουσώνες του Ινδικού Ωκεανού και να παρουσιάζει άφθονες βροχοπτώσεις και πυκνή βλάστηση. Αντίθετα, το βόρειο τμήμα έχει ερημικό και ξηρό κλίμα. Η περιοχή είναι κατά κύριο λόγο νεφοσκεπής καθ' όλη τη διάρκεια του έτους, με μόνο περίπου 10% καθαρές ημέρες. Η περιοχή αντιμετωπίζει αυξημένους κινδύνους γεωλογικών καταστροφών, ιδίως κατά τη διάρκεια του καλοκαιριού, το οποίο δέχεται πάνω από το 40% των ετήσιων βροχοπτώσεων. Η πρόσφατη κλιματική αλλαγή και το λιώσιμο των παγετώνων οδήγησαν στην ταχεία ανάπτυξη των αλπικών λιμνών στα Ιμαλάια. Κατά συνέπεια, τα Ανατολικά Ιμαλάια έχουν γίνει μια από τις πιο πυκνοκατοικημένες περιοχές για πλημμύρες από παγετώδεις λίμνες, με αποτέλεσμα τον υψηλότερο αριθμό νεκρών παγκοσμίως
Δεδομένα
Η σειρά Sentinel, που αναπτύχθηκε από τον Ευρωπαϊκό Οργανισμό Διαστήματος, περιλαμβάνει το Sentinel-1 για απεικόνιση με ραντάρ C-band που επικεντρώνεται στην παρακολούθηση της ξηράς και των ωκεανών με χωρική ανάλυση περίπου 5 m. Το Sentinel-2 είναι μια πολυφασματική αποστολή απεικόνισης υψηλής ανάλυσης που έχει σχεδιαστεί για την παρακολούθηση της ξηράς, προσφέροντας μέγιστη χωρική ανάλυση 10 m. Η μελέτη χρησιμοποίησε το σύνολο δεδομένων ALOS PALSAR με ραδιομετρική διόρθωση του εδάφους σε ψηφιακό μοντέλο υψομέτρου (DEM) που παρέχεται από το Alaska Satellite Facility. Αυτό το σύνολο δεδομένων προσφέρει πληροφορίες για το υψόμετρο σε αναλύσεις 12,5 m και 30 m, με το σύνολο δεδομένων ανάλυσης 12,5 m να χρησιμοποιείται για να ταιριάζει με τη χωρική ανάλυση των εικόνων Sentinel. Το σύνολο δεδομένων ελήφθη από το ASF Distributed Active Records Center.
Μεθοδολογία
Προεπεξεργασία δεδομένων
Το Google Earth Engine χρησιμοποιήθηκε για την επεξεργασία των καλοκαιρινών εικόνων Sentinel-1 και Sentinel-2 από το 2016 έως το 2020, αφαιρώντας τη νεφοκάλυψη και συνθέτοντας τα δεδομένα. Επιλέχθηκαν πολλαπλές ζώνες από το Sentinel-1 και το Sentinel-2, με διαφορετική χωρική ανάλυση, για να χαρακτηριστούν οι αλπικές λίμνες και το περιβάλλον τους. Η ζώνη βραχέων κυμάτων υπερύθρου (SWIR) του Sentinel-2 επαναδειγματοληπτήθηκε στα 10 m για να ταιριάζει με την ανάλυση των άλλων ζωνών. Τέσσερις μεταβλητές προέκυψαν από αυτές τις ζώνες για την ενίσχυση της αναπαράστασης του νερού, του εδάφους και του περιβάλλοντος για την εκπαίδευση δικτύων βαθιάς μάθησης. Επιπλέον, το σύνολο δεδομένων ALOS PALSAR DEM επαναδειγματοληπτήθηκε στα 10 m και μια μεταβλητή Relief προέκυψε υπολογίζοντας τη διαφορά μεταξύ της μέγιστης και της ελάχιστης τιμής εντός ενός πλέγματος 100 m × 100 m.
Οπτική ερμηνεία αλπικών λιμνών
Πραγματοποιήθηκε οπτική ανάλυση για τη συλλογή δεδομένων για την εκπαίδευση και την επικύρωση των μοντέλων αναγνώρισης και ταξινόμησης των αλπικών λιμνών. Τρεις διερμηνείς συμμετείχαν στην επισήμανση όλων των λιμνών στην περιοχή μελέτης εξετάζοντας οπτικά δορυφορικές εικόνες υψηλής ανάλυσης από το Google Earth. Οι εικόνες Sentinel-2 RGB χρησιμοποιήθηκαν ως δευτερεύουσα αναφορά όταν οι εικόνες RGB δεν ήταν διαθέσιμες ή επηρεάζονταν από σύννεφα. Οι διερμηνείς προσδιόρισαν οπτικά τον σχηματισμό παγετώδους ή μη παγετώδους λίμνης με βάση τους περιβαλλοντικούς παράγοντες που την περιβάλλουν, όπως η απόσταση από τους παγετώνες και τα ίχνη της κίνησης των παγετώνων. Οι παγετώδεις λίμνες χαρακτηρίστηκαν ως 1, ενώ οι μη παγετώδεις λίμνες χαρακτηρίστηκαν ως 0. Τα περιγράμματα των εντοπισμένων λιμνών σχεδιάστηκαν και αποθηκεύτηκαν σε ένα διανυσματικό σύνολο δεδομένων, με τους τύπους σχηματισμού τους ως χαρακτηριστικά των πολυγωνικών χαρακτηριστικών των λιμνών.
Αναγνώριση αλπικής λίμνης με βάση τη βαθιά μάθηση
Η ανάπτυξη ενός μοντέλου αναγνώρισης με βαθιά μάθηση για τις αλπικές λίμνες περιγράφεται στην Εικόνα 4, που περιλαμβάνει την εκπαίδευση δύο διαφορετικών δικτύων βαθιάς μάθησης για την αναγνώριση του περιγράμματος και του τύπου των αλπικών λιμνών. Η περιοχή μελέτης χωρίστηκε συστηματικά σε πλακίδια των 512 × 512 εικονοστοιχείων για τους αλγορίθμους κατάτμησης βαθιάς μάθησης, χρησιμοποιώντας την προβολή WGS 84/Pseudo-Mercator με κλίμακα 1:5000. Τα πλακίδια χωρίστηκαν σε ομάδες εκπαίδευσης και επικύρωσης κατά μήκος του ποταμού Arun.
Στα πλέγματα αποδόθηκαν οπτικές ετικέτες για τη δημιουργία δειγμάτων για εκπαίδευση και επικύρωση, με θετικά δείγματα που τέμνονται με αναγνωρισμένες λίμνες και αρνητικά δείγματα σε αντίθετη περίπτωση. Για την ταξινόμηση των λιμνών συλλέχθηκαν συνολικά 4584 δείγματα.
Η διαδικασία ταυτοποίησης περιλάμβανε δύο στάδια: κατάτμηση και ταξινόμηση. Το βήμα της τμηματοποίησης χρησιμοποίησε ένα δίκτυο Panoptic-DeepLab για τον εντοπισμό των περιγραμμάτων των λιμνών, ενώ το βήμα της ταξινόμησης έκανε διάκριση μεταξύ παγετώνων και μη παγετώνων λιμνών χρησιμοποιώντας ένα μοντέλο CoAtNet, που συνδυάζει τα νευρωνικά δίκτυα Convolutional Neural Networks και τα νευρωνικά δίκτυα Transformer.
Το μοντέλο τμηματοποίησης αλπικών λιμνών εκπαιδεύτηκε με συγκεκριμένες παραμέτρους, συμπεριλαμβανομένων των HRNet-48 backbone και Binary Dice Loss. Για τη μέτρηση της ακρίβειας τμηματοποίησης χρησιμοποιήθηκαν μετρικές αξιολόγησης, όπως η μέση διατομή πάνω από την ένωση (MIoU).
Τέσσερις συνδυασμοί μεταβλητών Sentinel-1, Sentinel-2 και μεταβλητών που προέκυψαν από DEM επιλέχθηκαν για τις εισροές του μοντέλου για την αξιολόγηση της ικανότητας αναγνώρισης αλπικών λιμνών. Το μοντέλο ταξινόμησης αλπικών λιμνών, εκπαιδευμένο με το CoAtNe.
Υπολογιστικό Περιβάλλον
Το υπολογιστικό περιβάλλον για το πείραμα δημιουργήθηκε σε σύστημα Linux. Για την υλοποίηση του πλαισίου δικτύου βαθιάς μάθησης επιλέχθηκε το PyTorch. Η εκπαίδευση των δικτύων βαθιάς μάθησης πραγματοποιήθηκε σε διακομιστή υπολογιστή εξοπλισμένο με 2 CPU (Intel Xeon Gold 5118 12 πυρήνες) και 16 GPU (NVIDIA Tesla K80 12G).
Αποτελέσματα
Προσδιορισμένες αλπικές λίμνες
Εντοπίστηκαν συνολικά 4584 αλπικές λίμνες, με μέση έκταση 0,038 km² και μέσο υψόμετρο 4974 m. Σε αυτές περιλαμβάνονται 2795 παγετώδεις λίμνες και 1789 μη παγετώδεις λίμνες. Οι παγετώδεις λίμνες παρουσίασαν μεγαλύτερο αριθμό, μεγαλύτερη έκταση και υψηλότερο υψόμετρο σε σύγκριση με τις μη παγετώδεις λίμνες. Η πλειονότητα των αλπικών λιμνών που εντοπίστηκαν ήταν μικρές, με το 87% να είναι μικρότερες από 0,05 km² και το 42% μικρότερες από 0,005 km². Από αυτές, 32 λίμνες ήταν μεγαλύτερες από 1 km², με μέση έκταση 1,9 km² και τη μεγαλύτερη λίμνη να καλύπτει 5,5 km². Περίπου το 57% των παγετωνικών λιμνών βρίσκονταν μεταξύ 5000 και 5500 m πάνω από το επίπεδο της θάλασσας.
Ακρίβεια τμηματοποίησης
Τα μοντέλα τμηματοποίησης πέτυχαν σύγκλιση των απωλειών μετά από 20 επαναλήψεις εκπαίδευσης, όπως υποδεικνύεται από τις ομαλές καμπύλες απώλειας εκπαίδευσης, γεγονός που υποδηλώνει την επιτυχή απόδοση του μοντέλου. Η μέση τομή πάνω από την ένωση (MIoU) για όλα τα δείγματα στα τέσσερα μοντέλα τμηματοποίησης κυμάνθηκε από 96,18% έως 97,40%, καταδεικνύοντας βελτιωμένη συνολική αποτελεσματικότητα τμηματοποίησης με την αύξηση των μεταβλητών εισόδου. Η MIoU για τα θετικά και αρνητικά δείγματα αυξήθηκε επίσης με πρόσθετα δεδομένα εισόδου, υποδεικνύοντας βελτιωμένη πληρότητα των αλπικών λιμνών και μειωμένη ψευδή ανίχνευση.
Όσον αφορά τα προβλεπόμενα πολύγωνα, τα τέσσερα μοντέλα τμηματοποίησης εντόπισαν ποικίλους αριθμούς λιμνών, που κυμαίνονταν από 1688 έως 1888 από τις 2075 παγετώδεις λίμνες στο σύνολο επικύρωσης. Τα ψευδώς θετικά πολύγωνα κυμάνθηκαν από 841 έως 3946 στα τέσσερα μοντέλα. Η αύξηση των δεδομένων εισόδου βελτίωσε αποτελεσματικά το ποσοστό ανίχνευσης και μείωσε τα ψευδώς θετικά αποτελέσματα.
Η οπτική ερμηνεία και οι αντίστοιχες προβλέψεις από τα τέσσερα μοντέλα τμηματοποίησης παρουσιάζονται στην Εικόνα 8. Το SegModel1 παρουσίασε την χειρότερη απόδοση όσον αφορά την πληρότητα των αλπικών λιμνών και τον έλεγχο των σφαλμάτων. Τα SegModel2 και SegModel3, μετά το συνδυασμό των δεδομένων MNDWI και Sentinel-1, παρουσίασαν βελτιωμένη πληρότητα αλλά εισήγαγαν περισσότερο θόρυβο λόγω σκιών. Το SegModel4, ενσωματώνοντας δεδομένα ανάγλυφου, μείωσε σημαντικά τις ψευδείς ανιχνεύσεις. Μεταξύ των τεσσάρων μοντέλων τμηματοποίησης, εκείνο που συνδυάζει και τα τέσσερα σύνολα δεδομένων επέδειξε την υψηλότερη ακρίβεια.
Ακρίβεια ταξινόμησης
Το μοντέλο ταξινόμησης έφτασε σε σύγκλιση στην απώλεια μετά από 25 επαναλήψεις, με κάθε επανάληψη να διαρκεί περίπου τέσσερα λεπτά. Η καλύτερη απόδοση του μοντέλου σημειώθηκε στην 18η επανάληψη, επιτυγχάνοντας συνολική ακρίβεια 86,41%, ακρίβεια χρήστη 86,62%, ακρίβεια παραγωγού 85,49% και F1-Score 86,05%.
Από τις 949 παγετώδεις λίμνες, 840 ταξινομήθηκαν σωστά, με αποτέλεσμα η ακρίβεια του παραγωγού να είναι 88,5%, η οποία ήταν υψηλότερη από εκείνη για τις μη παγετώδεις λίμνες που ήταν 84,6%. Ωστόσο, από τις 1126 μη παγετώδεις λίμνες, οι 953 ταξινομήθηκαν σωστά, με αποτέλεσμα η ακρίβεια του χρήστη να ανέρχεται σε 89,7%, ξεπερνώντας την ακρίβεια του χρήστη για τις παγετώδεις λίμνες σε 82,9%.
Συμπεράσματα
Ο συνδυασμός δορυφορικών δεδομένων υψηλής ανάλυσης και βαθιάς μάθησης αποδεικνύεται αποτελεσματικός στον ακριβή εντοπισμό και την ταξινόμηση αλπικών λιμνών, ιδίως παγετωνικών λιμνών. Η μελέτη αξιολογεί τη χρήση δεδομένων πολλαπλών πηγών, συμπεριλαμβανομένου του ραντάρ συνθετικού ανοίγματος (SAR) και των οπτικών δεδομένων, για τη βελτίωση των ποσοστών ανίχνευσης και τη μείωση των ψευδώς θετικών αποτελεσμάτων στον εντοπισμό αλπικών λιμνών. Η προσθήκη πληροφοριών μέσω διαφόρων μεταβλητών εισόδου μειώνει την αβεβαιότητα τμηματοποίησης. Προκλήσεις όπως η νεφοκάλυψη, οι σκιές και οι ανωμαλίες που επηρεάζουν την ακρίβεια τμηματοποίησης αντιμετωπίζονται με την ενσωμάτωση SAR, Relief και άλλων πηγών δεδομένων.
Η μελέτη υπογραμμίζει τους περιορισμούς των παραδοσιακών προσεγγίσεων, όπως η χρήση του τροποποιημένου δείκτη κανονικοποιημένης διαφοράς νερού (Modified Normalized Difference Water Index - MNDWI), και υπογραμμίζει την υπεροχή των μοντέλων βαθιάς μάθησης, ειδικά όταν χρησιμοποιούνται πολλαπλές εισόδους. Τα μοντέλα βαθιάς μάθησης υπερτερούν της μεθόδου MNDWI με βάση το κατώφλι στην ανίχνευση νερού, παρέχοντας υψηλότερη ακρίβεια και λιγότερα ψευδώς θετικά αποτελέσματα.
Κατά τη χαρτογράφηση των αλπικών λιμνών στα Ανατολικά Ιμαλάια κατά την περίοδο 2016-2020, η μελέτη εντοπίζει 4584 λίμνες, συμπεριλαμβανομένων 2795 παγετωνικών λιμνών. Η σύγκριση με τα υπάρχοντα σύνολα δεδομένων αποκαλύπτει αποκλίσεις, με την απογραφή της μελέτης να καταγράφει σημαντικά περισσότερες λίμνες στα ανατολικά Ιμαλάια, προσδιορίζοντας 2075 παγετώδεις και 1789 μη παγετώδεις λίμνες. Ο απολογισμός αυτός ξεπερνά τον αριθμό που αναφέρεται στα υπάρχοντα σύνολα δεδομένων κατά πέντε φορές, αποκαλύπτοντας πολυάριθμες παγετώδεις λίμνες που δεν έχουν καταγραφεί σε προηγούμενα σύνολα δεδομένων, ιδίως μικρές λίμνες απόψυξης των παγετώνων.
Ενώ η δυνατότητα μεταφοράς του μοντέλου έχει αξιολογηθεί στα ανατολικά Ιμαλάια, η αποτελεσματικότητά του σε περιοχές πέραν των Ιμαλαΐων ενδέχεται να είναι περιορισμένη λόγω προβλημάτων αναπαράστασης δεδομένων. Η ενσωμάτωση δεδομένων εκπαίδευσης από άλλες περιοχές θα μπορούσε να ενισχύσει την παγκόσμια εφαρμοσιμότητα του μοντέλου.