Μέθοδοι Βαθίας Μάθησης για την Ταξινόμηση Δορυφορικών Υπερφασματικών Δεδομένων.
Από RemoteSensing Wiki
Μέθοδοι Βαθίας Μάθησης για την Ταξινόμηση Δορυφορικών Υπερφασματικών Δεδομένων.
Πρωτότυπος τίτλος: Μέθοδοι Βαθίας Μάθησης για την Ταξινόμηση Δορυφορικών Υπερφασματικών Δεδομένων.
Συγγραφείς: Ουζουνίδης Γεώργιος
Δημοσιεύθηκε: 2020
Σύνδεσμος πρότυπου κειμένου: https://dspace.lib.ntua.gr/xmlui/handle/123456789/51891
Εισαγωγή
Η εργασία αυτή επικεντρώνεται πάνω στην διερεύνηση, παρουσίαση, εφαρμογή και αξιολόγηση μεθόδων σχετικών με την Βαθιά Μάθηση πάνω στην ταξινόμηση υπερφασματικών δεδομένων. Οι μέθοδοι αυτοί υλοποιούνται με την χρήση των νευρωνικών δικτύων. Η ανάπτυξη της Βαθιάς Μάθησης χαρακτηρίζει γενικότερα την εξέλιξη της Όρασης υπολογιστών. Η παρούσα εργασία ασχολήθηκε με τη διερεύνηση και παρουσίαση διάφορων μεθόδων Βαθιάς Μάθησης που εφαρμόζονται πάνω στις υπερφασματικές εικόνες. Οι μέθοδοι αυτές ξεχώρισαν στην επιστημονική κοινότητα και μπορούν να χαρακτηριστούν ως σύγχρονες μέθοδοι αιχμής για την χρονική στιγμή στην οποία ολοκληρώθηκε η συγκεκριμένη εργασία. Στην εργασία, επίσης εφαρμόστηκαν ταξινομήσεις σε υπερφασματικά δεδομένα, οι οποίες τελικά αξιολογήθηκαν ποσοτικά και ποιοτικά. Γενικά, η βαθιά μάθηση ανήκει στην οικογένεια της μηχανικής μάθησης αλλά αναφέρεται σε πολυπλοκότερους αλγόριθμους σε σχέση με τους συμβατικούς πάνω στην μηχανική μάθηση. Αυτοί επιτρέπουν στην μηχανή να αποκωδικοποιήσει και κατά συνέπεια, να μάθει πιο σύνθετα χαρακτηριστικά και συσχετισμούς των δεδομένων που δέχεται ως είσοδο.
Μεθοδολογία
Τα δεδομένα στα οποία χρησιμοποιήθηκαν οι μέθοδοι Βαθιάς Μάθησης προέρχονται από το HyRANK dataset, ενώ έγινε κανονικοποίηση αυτών, αφού σε όλα τα πειράματα οι φασματικές τιμές των εικονοστοιχείων των εικόνων μεταφέρθηκαν στο διάστημα [0,1]. Γενικότερα, έγινε προσπάθεια να διατηρηθούν οι υπερπαράμετροι που δίνονται στην βιβλιογραφία του κάθε δικτύου. Η διαφορετικότητα των δεδομένων εκπαίδευσης σε σχέση με τα δεδομένα που χρησιμοποιήθηκαν στην βιβλιογραφία απαιτεί την προσαρμογή αυτών για την ομαλή εκπαίδευση των δικτύων. Πραγματοποιήθηκε, λοιπόν η μέθοδος disjoint, η οποία χωρίζει τις περιοχές εκπαίδευσης με έναν τρόπο ρεαλιστικό για τους σκοπούς της επαλήθευσης. Έτσι, για την αρχική εκπαίδευση και τον προσδιορισμό των υπερπαραμέτρων χρησιμοποιήθηκαν 28312 εικονοστοιχεία από τα 33527 συνολικά χαρακτηρισμένα εικονοστοιχεία των 2 εικόνων. Για το σετ επαλήθευσης χρησιμοποιήθηκαν τα υπόλοιπα 5215, δηλαδή το 5.4%. Επιπλέον, προκειμένου να γίνει περισσότερο αντιληπτή η διαδικασία της ταξινόμησης των φασματικών εικόνων αλλά και η αποτελεσματικότητα των μεθόδων, χρησιμοποιούνται οι πίνακες σύγχυσης. Ένας πίνακας σύγχυσης περιέχει όλα τα στατιστικά στοιχεία τα οποία θα βοηθήσουν στην ερμηνεία τυχόν προβλημάτων της ταξινόμησης και κατά προέκταση στην επίλυση τους. Στην συνέχεια, χρησιμοποιήθηκαν επιγραμματικά το δίκτυο Hamida et al, τo δίκτυο Lee et al, το δίκτυο Chen et al, τo δίκτυο Li et al, το δίκτυο Hu et al, το δίκτυο Ηe et al, το δίκτυο Mou et al, το δίκτυο FDSSC και τo δίκτυο Liu et al. Χρησιμοποιήθηκαν, επίσης οι αλγόριθμοι: Μηχανές Διανυσματικής Υποστήριξης (SVM) που αποτελούν αλγόριθμους επιβλεπόμενης μάθησης που υπάγονται στην οικογένεια της Μηχανικής Μάθησης και η μέθοδος Τυχαίων Δασών (Random forest) κατά την οποία πραγματοποιείται ταξινόμηση που βασίζεται στην ύπαρξη δέντρων αποφάσεων
Συμπεράσματα
Στην συγκεκριμένη εργασία παρουσιάστηκαν διάφοροι μέθοδοι Βαθιάς Mάθησης για την ταξινόμηση υπερφασματικών δεδομένων, οι οποίες βασίστηκαν στην αντίστοιχη βιβλιογραφία και έγινε προσπάθεια εφαρμογής τους. Παρατηρώντας τις προβλέψεις στις εικόνες, γίνεται αμέσως αντιληπτό πώς η αίσθηση της χωρικής λεπτομέρειας στις εικόνες είναι διαφορετική ανά μέθοδο. Στις pixel-based μεθόδους όπως SVM,RF,Hu et al., οι εικόνες που παράχθηκαν αποτυπώνουν τις κατηγορίες χρήσεων γης με περισσότερη χωρική ακρίβεια. Στις μεθόδους που δέχονται γειτονιές των εικονοστοιχείων, οι προβλέψεις που δίνονται περιγράφουν τις χρήσεις γης με έναν γενικότερο τρόπο. Αξίζει να αναφερθεί πως η μέθοδος Liu et al. παρότι και αυτή δέχεται γειτονία 9x9 εικονοστοιχείων στην εισαγωγή, η προβλέψεις της δεν παρουσιάζουν τα χαρακτηριστικά αυτά. Αυτό οφείλεται στην ιδιότητα απαλλαγής του θορύβου του συγκεκριμένου δικτύου, σαν δίκτυο Κωδικοποιητή-Αποκωδικοποιητή που εκπαιδεύεται στην ανασύσταση της εισαγωγής απαλλαγμένης από τον θόρυβο. Από την σκοπιά της ολικής ακρίβειας και του χρόνου παραγωγής της ταξινόμησης, η καθιερωμένη μέθοδος SVM επικρατεί των υπολοίπων, επιτυγχάνοντας την υψηλότερη ολική ακρίβεια.