Μοντελοποίηση Κατάλληλων Οικοτόπων Αποδημητικών Πτηνών μέσω Τηλεπισκόπησης και Συνελικτικών Νευρωνικών Δικτύων
Από RemoteSensing Wiki
Πρωτότυπος τίτλος: Modeling Habitat Suitability of Migratory Birds from Remote Sensing Images Using Convolutional Neural Networks
Συγγραφείς: Jin-He Su, Ying-Chao Piao, Ze Luo, Bao-Ping Yan
Δημοσιεύθηκε: MDPI, animals
Link: https://www.mdpi.com/2076-2615/8/5/66
Αντικείμενο
Το συγκεκριμένο άρθρο εστιάζει την μελέτη του γύρω από την χήνα bar-headed goose (γνωστή στην Ελλάδα ως Ινδική χήνα). Σκοπός της μελέτης είναι να δημιουργήσει χάρτες καταλληλότητας (suitability maps) για την Ινδική Χήνα κάνοντας χρήση δεδομένων κίνησης σε συνδυασμό με εικόνες από απομακρυσμένους αισθητήρες (remote sensing) και δεδομένα από περιβαλλοντικούς παράγοντες, όπως είναι για παράδειγμα η θερμοκρασία. Κατανοώντας με τις παραπάνω μεθόδους την χωρική και χρονική κατανομή των ειδών στον χώρο θα βοηθήσει στην καλύτερη και αποτελεσματικότερη προστασία και διαχείριση της άγριας πανίδας.
Γιατί είναι σημαντική η τηλεπισκόπηση;
Η παραδοσιακή niche-based μέθοδος για την κατανομή των ειδών άγριας πανίδας έχει δύο βασικά μειονεκτήματα. Πρώτον, τα υπάρχοντα δεδομένα από large-scale έρευνες, μουσεία και άλλες συλλογές, παρέχουν πληροφορίες μόνο για το όνομα της χώρας ή της πόλης λήψης των δεδομένων και ελάχιστα από αυτά μπορούν να χρησιμοποιηθούν αξιόπιστα σε μελέτες. Δεύτερον, δεν παρέχουν αρκετή πληροφορία σχετικά με τα χωρικά χαρακτηριστικά των περιοχών. Τα δορυφορικά δεδομένα από την άλλη παρέχουν άφθονή πληροφορία η οποία με τη χρήση της τηλεπισκόπησης και των εργαλείων που αυτή παρέχει για την επεξεργασία αυτών των άλλων δεδομένων μπορούμε να έχουμε μια αναλυτική εικόνα του ανάγλυφου της περιοχής, των υδρολογικών χαρακτηριστικών κ.α.
Μεθοδολογία
Στην συγκεκριμένη μελέτη έγινε έρευνα με την χρήση ενός αλγορίθμου με 2 στάδια προκειμένου να λάβουμε αποτελέσματα από τον συνδυασμό των δεδομένων κίνησης και των δεδομένων των εικόνων remote sensing από τον Landsat 5 TM.
Αρχικά εισάγεται μια νέα μέθοδος αναγνώρισης των στάσεων των αποδημητικών πουλιών, η οποία βασίζεται στην πυκνότητα τους όπως αυτή φαίνεται στις τηλεπισκοπηκες εικόνες.Συγκεκριμένα οι εικόνες του απομακρυσμένου αισθητήρα χωρίζονται σε κομμάτια 16x16 και όταν κάποιο από αυτά έχει επικάλυψη (overlap) με δεδομένα στάσης, το κομμάτι αυτό χαρακτηρίζεται ως “θετικό”. Έπειτα με τη χρήση ενός μοντέλου multi-convolution neural network εξάγονται πληροφορίες για την θερμοκρασία από ατμοσφαιρικά δεδομένα και τέλος με τη βοήθεια ενός Support Vector Machine (SVM) μοντέλου γίνεται συνδυασμός όλων των πληροφοριών και δημιουργείται η τελική ταξινόμηση.
Πιο αναλυτικά, ο αλγόριθμος χωρίζεται σε 4 βασικά στάδια : 1. Παίρνουμε πληροφορίες για το ποιες είναι οι στάσεις των πουλιών (της Ινδικής Χήνας) από τον αλγόριθμο GPS tracks του DBIC.O DBIC είναι ένας density-based αλγόριθμος που καθορίζει χωροχρονικά την πυκνότητα του αντικειμένου ενδιαφέροντος σε ένα σημείο κάνοντας χρήση της global και της trajectory density. Για τον υπολογισμό αυτών γίνεται χρήση της γκαουσιανής συνάρτησης Ιnfluence η οποία ορίζεται ως εξής:
Ορισμός:
H συνάρτηση Influence για ένα σημείο y δίνεται από τον τύπο: <math> (f^y)\index{Gauss}(x)=f(x,y)=e^(-(d(x,y))^2)/(2(σ^2)) </math>
Όπου d(x,y) είναι η Ευκλείδεια απόσταση του x από το y.
Η global density ενός σημείου υπολογίζεται ως το άθροισμα των τιμών της influence από τα γειτονικά σημεία αλλά και από σημεία άλλων τροχιών (trajectories). H trajectory density υπολογίζεται ως η influence μεταξύ του σημείου ενδιαφέροντος και ενός γειτονικού του.
Στην συγκεκριμένη μελέτη χρησιμοποιείται το άθροισμα του global και του trajectory density για να υπολογιστεί το πόσο σημαντικό είναι ένα σημείο. Για παράδειγμα στην Εικόνα 3 ενώ και τα δύο σημεία έχουν την ίδια βαρύτητα, με την μέθοδο της συγκεκριμένης μελέτης το p2 θεωρείται πιθανότερο σημείο στάσης.
Στην Εικόνα 4 φαίνεται η ταξινόμηση των στάσεων, αποτέλεσμα που έδωσε ο DBIC, και δείχνει 290 στάσεις ανάμεσα στην λίμνη Qinghai και των περιοχών της χειμερινής εγκατάστασης της χήνας όπως για παράδειγμα οι λίμνες Hala και Lhasa.
2. Οι Landsat φωτογραφίες σε συνδυασμό με τις πληροφορίες για την θερμοκρασία διαχωρίστηκαν σε θετικές αν στην έκταση που καλύπτει η εικόνα βρίσκεται κάποια στάση και αρνητικές αν δεν υπάρχει.
3. Οι εικόνες που ταξινομήθηκαν στο προηγούμενο στάδιο χρησιμοποιούνται για να εκπαιδευτεί ένα M-CNN network.
4. Από το εκπαιδευμένο μοντέλο M-CNN εξάγονται τα δεδομένα αναπαράστασης και χρησιμοποιούνται για να φτιαχτεί τελικά o suitability map με το SVM μοντέλο.
Ταξινόμηση με M-CNN
Με τα Convolutional Neural Networks μπορούν να χρησιμοποιηθούν πολλά φίλτρα σε κάθε convolutional layer. Στην συγκεκριμένη εργασία χρησιμοποιούνται one-dimensional convolution για την εξαγωγή των δεδομένων θερμοκρασίας και two-dimensional για την εξαγωγή των remote sensing εικόνων που έχουν χαρακτηριστεί ως θετικές (που συμπεριλαμβάνουν δηλαδή σημεία στάσης) Στη συνέχεια σχεδιάστηκε ένα M-CNN το οποίο συγκρίνει ταυτόχρονα τα 1-dimensional και 2-dimensional convolutions. Για την συγκεκριμένη έρευνα έγινε χρήση τριών data sets: Των real trajectory datasets από 29 Ινδικές Χήνες, Από εικόνες του Landsat 5 TM του U.S. Geological Survey. Κάθε εικόνα χωρίστηκε σε μικρότερες εικόνες 16x16 pixels. Για την έρευνα χρησιμοποιήθηκαν τα bands 1, 2, 3, 4, 5 και 7 και επιλέχθηκαν φωτογραφίες με cloud cover μικρότερο του 20%. Dataset θερμοκρασίας από το National Oceanic and Atmospheric Administration.
Αποτελέσματα:
Τα αποτελέσματα της συγκεκριμένης έρευνας δείχνουν ότι το χρησιμοποιούμενο μοντέλο υπερτερεί σε σχέση με της υπάρχουσες μεθόδους. Η μέθοδος M-CNN σε συνδυασμό με την ταξινόμηση Support Vector Machine (SVM) και τη χρήση των Landsat 5 εικόνων, πετυχαίνει καλή απόδοση στον ακριβή εντοπισμό των στάσεων αλλά και της πρόβλεψης της θέσης αυτών. Λόγω του συνδυασμού διαφορετικών datasets και των δυνατοτήτων που μας προσφέρουν οι αλγόριθμοι CNN και τα εργαλεία επεξεργασίας τηλεσκοπικών εικόνων, αυτή η προσέγγιση ενδέχεται να είναι ενδιαφέρουσα για την μελέτη και άλλων ειδών άγριας πανίδας ακόμα και με πιο περιορισμένα δεδομένα