Μοντελοποίηση της Κατοικισιμότητας Περιοχών από Μεταναστευτικα Πουλιά με τη χρήση Συνελικτικών Νευρωνικών Δικτύων
Από RemoteSensing Wiki
(Νέα σελίδα με ''''Modeling Habitat Suitability of Migratory Birds from Remote Sensing Images Using Convolutional Neural Networks''' Συγγραφείς: ''Jin-He Su, Ying-Chao Piao, Z...') |
|||
Γραμμή 15: | Γραμμή 15: | ||
Αρχικά οι ερευνητές εξήγαγαν τα σημεία ενδιαφέροντος από τι ίχνος του GPS χρησιμοποιώντας τον αλγόριθμο DBIC. Στη συνέχεια, οι εικόνες Landsat μαζί με τα δεδομένα της θερμοκρασίας χωρίστηκαν σε θετικά/αρνητικά δείγματα ανάλογα με το αν η εικόνα έχει επικάλυψη με κάποιες θέσεις στάσης. Τρίτον, τα ταξινομημένα δείγματα χρησιμοποιήθηκαν για την εκπαίδευση του πολυσυνελικτικού νευρωνικού δικτύου. Τέλος, τα αντιπροσωπευτικά στοιχεία που αναγνώρισε το νευρωνικό δίκτυο χρησιμοποιήθηκαν για να μοντελοποιηθεί η καταλληλότητα της κατοικίας για τα μεταναστευτικά πουλιά με το μοντέλο SVM. | Αρχικά οι ερευνητές εξήγαγαν τα σημεία ενδιαφέροντος από τι ίχνος του GPS χρησιμοποιώντας τον αλγόριθμο DBIC. Στη συνέχεια, οι εικόνες Landsat μαζί με τα δεδομένα της θερμοκρασίας χωρίστηκαν σε θετικά/αρνητικά δείγματα ανάλογα με το αν η εικόνα έχει επικάλυψη με κάποιες θέσεις στάσης. Τρίτον, τα ταξινομημένα δείγματα χρησιμοποιήθηκαν για την εκπαίδευση του πολυσυνελικτικού νευρωνικού δικτύου. Τέλος, τα αντιπροσωπευτικά στοιχεία που αναγνώρισε το νευρωνικό δίκτυο χρησιμοποιήθηκαν για να μοντελοποιηθεί η καταλληλότητα της κατοικίας για τα μεταναστευτικά πουλιά με το μοντέλο SVM. | ||
- | |||
'''Πείραμα''' | '''Πείραμα''' | ||
- | ''Δεδομένα:'' | + | '''''Δεδομένα:''''' |
Για κάθε στάση που έδωσε το GPS, βρέθηκαν οι κοντινότερες χρονικά εικόνες του Landsat 5, στη συνέχεια οι εικόνες χωρίστηκαν σε κελιά 16x16 και αυτά χαρακτηρίστηκαν ως θετικά ή αρνητικά ανάλογα με τον αν περιέχουν στάσεις ή όχι. Εικόνες με νεφοκάλυψη πάνω από 20% απορρίφθηκαν και χρησιμοποιήθηκαν τα κανάλια 1,2,3,4,5 και 7 του δορυφόρου. | Για κάθε στάση που έδωσε το GPS, βρέθηκαν οι κοντινότερες χρονικά εικόνες του Landsat 5, στη συνέχεια οι εικόνες χωρίστηκαν σε κελιά 16x16 και αυτά χαρακτηρίστηκαν ως θετικά ή αρνητικά ανάλογα με τον αν περιέχουν στάσεις ή όχι. Εικόνες με νεφοκάλυψη πάνω από 20% απορρίφθηκαν και χρησιμοποιήθηκαν τα κανάλια 1,2,3,4,5 και 7 του δορυφόρου. | ||
Τα θερμικά δεδομένα είναι από 11 σταθμούς στην περιοχή και αποτελούνται από την μέση ημερήσια θερμοκρασία πριν και μετά τη λήψη της δορυφορικής εικόνας, συνολικά 15 ημερών. | Τα θερμικά δεδομένα είναι από 11 σταθμούς στην περιοχή και αποτελούνται από την μέση ημερήσια θερμοκρασία πριν και μετά τη λήψη της δορυφορικής εικόνας, συνολικά 15 ημερών. | ||
Γραμμή 28: | Γραμμή 27: | ||
[[Αρχείο:ChLDPMS2019Metsovo3a.png|200px|thumb|right|Κατανομή των στάσεων, μπλέ τα σημεία του GPS, πράσινα τα αποτελέσματα της μεθόδου και κόκκινες οι θέσεις των μετεωρολογικών σταθμών.]] | [[Αρχείο:ChLDPMS2019Metsovo3a.png|200px|thumb|right|Κατανομή των στάσεων, μπλέ τα σημεία του GPS, πράσινα τα αποτελέσματα της μεθόδου και κόκκινες οι θέσεις των μετεωρολογικών σταθμών.]] | ||
[[Αρχείο:ChLDPMS2019Metsovo3b.png|200px|thumb|right|Αποτελέσματα για τις διαφορετικές μεθόδους που χρησιμοποιήθηκαν, με bold οι καλύτερες τιμές]] | [[Αρχείο:ChLDPMS2019Metsovo3b.png|200px|thumb|right|Αποτελέσματα για τις διαφορετικές μεθόδους που χρησιμοποιήθηκαν, με bold οι καλύτερες τιμές]] | ||
- | ''Αποτελέσματα:'' | + | '''''Αποτελέσματα:''''' |
Τα αποτελέσματα ταξινόμησης για κάθε μέθοδο που χρησιμοποιήθηκε φαίνονται στον πίνακα. Οι μέθοδοι που εφαρμόστηκαν είναι: η προσέγγιση του SVM με τη χρήση του grey-level co-occurence matrix (GLCM), DenseNet, συνελικτικού νευρωνικού δικτύου (CNN), CNN + SVM, πολυσυνελικτικού νευρωνικού δικτύου M-CNN και M-CNN + SVM. | Τα αποτελέσματα ταξινόμησης για κάθε μέθοδο που χρησιμοποιήθηκε φαίνονται στον πίνακα. Οι μέθοδοι που εφαρμόστηκαν είναι: η προσέγγιση του SVM με τη χρήση του grey-level co-occurence matrix (GLCM), DenseNet, συνελικτικού νευρωνικού δικτύου (CNN), CNN + SVM, πολυσυνελικτικού νευρωνικού δικτύου M-CNN και M-CNN + SVM. | ||
Για την μέτρηση της ποιότητας των αλγορίθμων χρησιμοποιούνται η συνολική ακρίβεια, η τιμή F1, η περιοχή κάτω από την καμπύλη (AUC) του ROC (receiver operating characteristic), η ακρίβεια και η ευαισθησία (recall). | Για την μέτρηση της ποιότητας των αλγορίθμων χρησιμοποιούνται η συνολική ακρίβεια, η τιμή F1, η περιοχή κάτω από την καμπύλη (AUC) του ROC (receiver operating characteristic), η ακρίβεια και η ευαισθησία (recall). |
Αναθεώρηση της 12:42, 22 Φεβρουαρίου 2020
Modeling Habitat Suitability of Migratory Birds from Remote Sensing Images Using Convolutional Neural Networks
Συγγραφείς: Jin-He Su, Ying-Chao Piao, Ze Luo και Bao-Ping Yan
Δημοσιεύτηκε: Animals 2018, 8, 66.
Σύνδεσμος: https://doi.org/10.3390/ani8050066
Εισαγωγή
Υπάρχουν δύο σημαντικοί περιορισμοί στα παραδοσιακά μοντέλα κατανομής πληθυσμού ενός είδους. Ο ένας είναι η έλλειψη ακρίβειας στα υπάρχοντα χωρικά δεδομένα (συνήθως σε μουσεία και παλιές συλλογές). Ο δεύτερος είναι η απουσία εύστοχων μεταβλητών για να περιγράφονται πλήρως τα χαρακτηριστικά της κατοικίας ενός είδος. Στη συγκεκριμένη έρευνα, μία ταξινόμηση σε δύο στάδια πραγματοποιήθηκε για τον συνδυασμό των δεδομένων της μετακίνησης. Αρχικά προτείνεται μία νέα μέθοδος ομαδοποίησης βασιζόμενη στην πυκνότητα (DBIC) για τον εντοπισμό των σημείων στάσεων των μεταναστευτικών πουλιών. Χωρίζουμε τις τηλεπισκοπικές εικόνες σε τμήματα 16x16 και τις σηματοδοτούμε ως θετικές αν περιέχουν στάση πουλιών. Στη συνέχεια ένα πολυσυνελικτικό νευρωνικό δίκτυο προτείνεται για την εξαγωγή στοιχείων από δεδομένα θερμοκρασίας και τηλεπισκοπικές εικόνες. Τέλος ένα μη γραμμικό μοντέλο μηχανής διανυσμάτων υποστήριξης βασισμένο σε συναρτήσεις πυρήνα (RBF-SVM) χρησιμοποιήθηκε για τον συνδυασμό όλων των στοιχείων και την εξαγωγή της ταξινόμησης. Η ανάλυση πραγματοποιήθηκε σε εικόνες Landsat 5 TM και σε ένα σύνολο δεδομένων GPS συλλεγμένο από 29 πουλιά μέσα σε τρία χρόνια.
Μεθοδολογία
Αρχικά οι ερευνητές εξήγαγαν τα σημεία ενδιαφέροντος από τι ίχνος του GPS χρησιμοποιώντας τον αλγόριθμο DBIC. Στη συνέχεια, οι εικόνες Landsat μαζί με τα δεδομένα της θερμοκρασίας χωρίστηκαν σε θετικά/αρνητικά δείγματα ανάλογα με το αν η εικόνα έχει επικάλυψη με κάποιες θέσεις στάσης. Τρίτον, τα ταξινομημένα δείγματα χρησιμοποιήθηκαν για την εκπαίδευση του πολυσυνελικτικού νευρωνικού δικτύου. Τέλος, τα αντιπροσωπευτικά στοιχεία που αναγνώρισε το νευρωνικό δίκτυο χρησιμοποιήθηκαν για να μοντελοποιηθεί η καταλληλότητα της κατοικίας για τα μεταναστευτικά πουλιά με το μοντέλο SVM.
Πείραμα
Δεδομένα: Για κάθε στάση που έδωσε το GPS, βρέθηκαν οι κοντινότερες χρονικά εικόνες του Landsat 5, στη συνέχεια οι εικόνες χωρίστηκαν σε κελιά 16x16 και αυτά χαρακτηρίστηκαν ως θετικά ή αρνητικά ανάλογα με τον αν περιέχουν στάσεις ή όχι. Εικόνες με νεφοκάλυψη πάνω από 20% απορρίφθηκαν και χρησιμοποιήθηκαν τα κανάλια 1,2,3,4,5 και 7 του δορυφόρου. Τα θερμικά δεδομένα είναι από 11 σταθμούς στην περιοχή και αποτελούνται από την μέση ημερήσια θερμοκρασία πριν και μετά τη λήψη της δορυφορικής εικόνας, συνολικά 15 ημερών. Ακολουθήθηκαν τρεις διαφορετικές μέθοδοι για την διεξαγωγή του πειράματος. Στην πρώτη, για την εκπαίδευση του δικτύου χρησιμοποιήθηκε μία απλή μέθοδος αύξησης των δεδομένων, η περιστροφή των 6.065 τυχαίων θετικών δειγμάτων εκπαίδευσης κατά 90ο και 180ο. Αυτή η τεχνική χρησιμοποιήθηκε για να ισορροπήσει το πλήθος των δειγμάτων καθώς από τον DBIC προέκυψαν 8.696 θετικά και 19.018 αρνητικά δείγματα. Το δείγμα εκπαίδευσης χωρίστηκε τέσσερις φορές σε τρία μέρη τυχαία, εκπαίδευση, επαλήθευση και έλεγχος. Κάθε φορά ήταν άλλα τα ποσοστά στα οποία μοιράστηκε και στο τέλος συγκρίθηκαν οι μέσοι και οι τυπικές αποκλίσεις για κάθε καταμερισμό. Στην δεύτερη μέθοδο, χρησιμοποιήθηκε διάφορες ταξινομήσεις για την πρόβλεψη της καταλληλότητας των περιοχών της λίμνης Qinghai στις 22 Φεβρουαρίου και 14 Αυγούστου, δύο ημερομηνίες που γνωρίζουμε πως η λίμνη είναι πολύ ακατάλληλη και πολύ κατάλληλη αντίστοιχα. Στο τρίτο σενάριο επιλέχθηκαν τέσσερα θετικά δείγματα και χρησιμοποιήθηκε μία διαδικασία αποσυνέλιξης για να ανακατασκευαστούν οι αρχικές εικόνες κάθε επιπέδου του πολυσυνελικτικού δικτύου. Έτσι υπολογίστηκε η απώλεια δεδομένων σε σχέση με την πραγματική εικόνα.
Αποτελέσματα: Τα αποτελέσματα ταξινόμησης για κάθε μέθοδο που χρησιμοποιήθηκε φαίνονται στον πίνακα. Οι μέθοδοι που εφαρμόστηκαν είναι: η προσέγγιση του SVM με τη χρήση του grey-level co-occurence matrix (GLCM), DenseNet, συνελικτικού νευρωνικού δικτύου (CNN), CNN + SVM, πολυσυνελικτικού νευρωνικού δικτύου M-CNN και M-CNN + SVM. Για την μέτρηση της ποιότητας των αλγορίθμων χρησιμοποιούνται η συνολική ακρίβεια, η τιμή F1, η περιοχή κάτω από την καμπύλη (AUC) του ROC (receiver operating characteristic), η ακρίβεια και η ευαισθησία (recall).
Συζήτηση
Στο πρώτο σενάριο, το μοντέλο αποδίδει καλύτερα από πολλές μεθόδους όσον αφορά όλους τους δείκτες. Ωστόσο οι προσεγγίσεις SVM + GLCM και DenseNet έχουν και οι δύο κακή απόδοση στην ταξινόμηση και στην πρόβλεψη. Επίσης από την σύγκριση των δύο CNN με τα CNN + SVM, φαίνεται πως η χρήση του σταδίου ταξινόμησης SVM είναι απαραίτητο για την επιτυχία καλύτερου αποτελέσματος όταν γίνεται χρήση συνελικτικού νευρωνικού δικτύου. Τέλος οι προσεγγίσεις DenseNet, CNN + SVM και M-CNN φαίνονται να εκτιμούν σωστά τις περιοχές που προτιμούν οι χήνες να κατοικήσουν γύρω από τη λίμνη στο δεύτερο σενάριο και αποδίδουν επίσης καλύτερα από άλλες προσεγγίσεις κάτω από αυτή τη σκοπιά. Άρα συνολικά οι συγγραφείς προτείνουν ως πλέον αποδοτική από τις μεθόδους που εξετάστηκαν την M-CNN συνδυασμό με τον RBF-SVM ταξινομητή.