Land Use Classification Method of Remote Sensing Images for Urban and Rural Planning Monitoring Using Deep Learning

Από RemoteSensing Wiki

(Διαφορές μεταξύ αναθεωρήσεων)

Μετάβαση σε: πλοήγηση, αναζήτηση

Αναθεώρηση της 15:40, 14 Μαρτίου 2023

Εικόνα 1:Αρχιτεκτονική του βασικού μοντέλου U-Net.

Εικόνα 2:Βελτιωμένη δομή του μοντέλου U-Net.

Εικόνα 3: Αλλαγές ακρίβειας και αξίας απώλειας κατά τη διάρκεια βελτιωμένης προπόνησης U-Net. (α) Καμπύλη διακύμανσης ακρίβειας μοντέλου. (β) Αλλαγή καμπύλης του τιμή απώλειας μοντέλου.

Εικόνα 4: Αποτελέσματα τμηματοποίησης εικόνας διαφορετικών μεθόδων.

Εικόνα 5: Σύγκριση αποτελεσμάτων τμηματοποίησης διαφορετικών μοντέλων. (α) Μέση τιμή της ακρίβειας, της ανάκλησης και των τιμών F1. (β) Συνολική ακρίβεια.

ΜΕΘΟΔΟΣ ΤΑΞΙΝΟΜΗΣΗΣ ΧΡΗΣΕΩΝ ΓΗΣ ΤΩΝ ΕΙΚΟΝΩΝ ΔΟΡΥΦΟΡΙΚΗΣ ΤΗΛΕΠΙΣΚΟΠΗΣΗΣ ΓΙΑ ΤΗΝ ΠΑΡΑΚΟΛΟΥΘΗΣΗ ΤΟΥ ΑΣΤΙΚΟΥ & ΑΓΡΟΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ ΜΕ ΤΗΝ ΧΡΗΣΗ ΤΟΥ DEEP LEARNING. ΤΙΤΛΟΣ: Land Use Classification Method of Remote Sensing Images for Urban and Rural Planning Monitoring Using Deep Learning ΣΥΓΓΡΑΦΕΙΣ: 1Xiaoling Xie,1Xueqin Kang,1Lei Yan,1Liqin Zeng,1and Lin Ye1 ΠΗΓΗ: https://www.hindawi.com/journals/sp/2022/8381189/ 1.Εισαγωγή Η κάλυψη γης είναι ένα σύμπλεγμα διαφόρων στοιχείων της επιφάνειας που καλύπτεται από φυσικά περιβαλλοντικά είδη και τεχνικά έργα. Τα τελευταία χρόνια χρησιμοποιώντας την τηλεπισκόπηση, η λήψη εικόνων υψηλής ανάλυσης για την ταξινόμηση και τη μελέτη της επιφάνειας δεν συμβάλλει μόνο στην προστασία του περιβάλλοντος αλλά και στη σταθερή βελτίωση της εθνικής οικονομίας και στην υγιή ανάπτυξη των αστικών και αγροτικών περιοχών(O.Charfi Marrakchi et al.,2021). Το deep learning είναι ένας πολύ αποτελεσματικός αλγόριθμος μάθησης, ο οποίος ξεπερνά την ακρίβεια των παραδοσιακών αλγορίθμων και είναι η κύρια κατεύθυνση της μελλοντικής έρευνας στον τομέα της τηλεπισκόπησης (O.Youme et al.,2021). Ως εκ τούτου, αυτό το έγγραφο προτείνει μια μέθοδο ταξινόμησης χρήσης γης του αστικού και αγροτικού σχεδιασμού που παρακολουθεί εικόνες τηλεπισκόπησης χρησιμοποιώντας το deep learning 2. Μοντέλο ταξινόμησης βασισμένο σε βελτιωμένο U-Net 2.1. Περιγραφή προβλήματος

Σήμερα, σε πολλά ανώριμα πεδία, όπως ο σημασιολογικός διαχωρισμός/ τμηματοποίηση μιας εικόνας τηλεπισκόπησης, είναι δύσκολο να ληφθεί ένα επίπεδο δεδομένων με καλό σημασιολογικό σχολιασμό (M.M.Hasan et al.,2021). Επομένως, ο τρόπος εκπαίδευσης ενός καλού μοντέλου διαχωρισμού/τμηματοποίησης σε ένα μικρό δείγμα συνόλου δεδομένων εικόνας τηλεπισκόπησης είναι το επίκεντρο των ερευνητών(S.Noppitak and O. Surinta,2021). Προκειμένου να επιλυθούν τα παραπάνω προβλήματα, προτείνεται ένα βελτιωμένο μοντέλο νευρωνικού δικτύου σε αυτό το έγγραφο. 2.2. Βελτιωμένο μοντέλο U-Net 2.2.1. Βασικό μοντέλο U-Net

                                                                                                                                                                           Το βασικό μοντέλο U-Net έχει τυπική δομή κωδικοποιητή-αποκωδικοποιητή, όπως φαίνεται στο Σχήμα 1. Η βασική αρχιτεκτονική U-Net έχει πέντε επίπεδα και το συνολικό δίκτυο είναι σε συμμετρική δομή. Στα αριστερά υπάρχει μια τυπική δομή νευρωνικού δικτύου (neural network structure) ενώ στη δεξιά πλευρά, πραγματοποιείται πρώτα η διαδικασία της επαναδειγματοληψίας(upsampling) και το μέγεθος του πυρήνα συνέλιξης(convolution kernel) είναι 2x2. Η συνέλιξη και η επαναδειγματοληψία σε αυτήν τη διαδικασία πρέπει να χρησιμοποιούν τη λειτουργία ενεργοποίησης της διορθωμένης γραμμικής μονάδας (ReLU) όπου χρησιμοποιείται το στρώμα U-Net.

2.2.2. Βελτιωμένο μοντέλο U-Net

                                                                                                                                                            Η συνολική συμμετρική δομή του δικτύου αποτελείται κυρίως από δύο μέρη: τον κωδικοποιητή στο αριστερό μισό του διαγράμματος και τον αποκωδικοποιητή στο δεξί μισό του Γραφήματος 2. Το U-Net υιοθετεί τη μέθοδο της υπέρθεσης καναλιών για συρραφή και σύντηξη χαρακτηριστικών, δηλαδή, προκειμένου να βελτιωθεί περαιτέρω η ακρίβεια διαχωρισμού/τμηματοποίησης, το U-Net στοιβάζει τα χαρακτηριστικά που εξάγονται κατά τη διαδικασία κωδικοποίησης με την αντίστοιχη διαδικασία αποκωδικοποίησης (H. Wei et al.,2020;P.Zhang and S. Hu,2019).Αυτή η μέθοδος μπορεί όχι μόνο να διατηρήσει στο μέγιστο βαθμό τα χαρακτηριστικά γνωρίσματα κατά τη διαδικασία μείωσης του δειγματοληπτικού ρυθμού (downsampling)  πληροφορίες χαρακτηριστικών στη διαδικασία μείωσης δειγματοληψίας στο μέγιστο βαθμό, αλλά και να κάνει το δίκτυο να περιέχει τόσο σημασιολογικά χαρακτηριστικά υψηλού επιπέδου όσο και χαρακτηριστικά λεπτομέρειας χαμηλού επιπέδου κατά τη διαδικασία επαναδειγματοληψίας (upsampling). Επιπλέον, το U-Net έχει μια μοναδική "συμμετρική δομή σχήματος U", η οποία ευνοεί την κατάτμηση της λεπτής εικόνας.                                                                                                                                                                                                                        2.3. Στρατηγική Βελτιστοποίησης του Μοντέλου Δικτύου                                                                                                                                        2.3.1. Ομαλοποίηση των τεχνιτών νευρωνικών δικτύων(batch normalization) .    
                                                                                                                                                                           Η έννοια του batch normalization προτάθηκε από την Google το 2015. Κατά τη διάρκεια της διαδικασίας διαδικασίας αυτής , οι παράμετροι του μοντέλου αλλάζουν συνεχώς και η κατανομή των δεδομένων εισόδου σε κάθε επίπεδο αλλάζει επίσης με αποτέλεσμα να δημιουργούνται πολλά προβλήματα (J.Hu, D et al.,2019; S. Shen et al.,2019). Η πρόταση της batch normalization μπορεί να δώσει λύση ενώ χωρίζεται σε 2 βήματα: την ομαλοποίηση και τον μετασχηματισμό.                                                                                                                                            2.3.2. Ενεργοποίηση λειτουργίας SeLU.  
                                                                                                                                                        Το SeLU μπορεί να ομαλοποιήσει αυτόματα την κατανομή του δείγματος με μέσο όρο 0 και τη μοναδιαία διακύμανση  αφού ενεργοποιηθεί η λειτουργία (W.Xiao et al.,2019). Η αυτο-κανονικοποίηση διασφαλίζει ότι η κλίση δεν θα αποκλίνει ή θα μηδενιστεί και το αποτέλεσμα είναι καλύτερο από την ομαλοποίηση των τεχνιτών νευρωνικών δικτύων(batch normalization) . Οι λειτουργίες ενεργοποίησης όπως το ReLU χρησιμοποιούνται στην περίπτωση που η κλίση του αρνητικού μισού άξονα είναι ήπια αλλά η θετική κλίση του μισού άξονα είναι απλά ορισμένη ως 1.                                                                                                                                                                                                                            3. Πείραμα και ανάλυση 
                                                                                                                                                                                                                                               Το πείραμα βασίζεται στο λειτουργικό σύστημα Ubuntu 16.04 LTS και χρησιμοποιεί το πλαίσιο μεθόδου deep learning TensorFlow για να δημιουργήσει ένα βελτιωμένο μοντέλο U-Net.                                                                                                                                                                                                                3.1. Σύνολο δεδομένων και δείκτης αξιολόγησης    
                                                                                                                                                                                 Πέντε είδη δημόσιων δεδομένων από τηλεπισκοπικές εικόνες GID χρησιμοποιούνται ως πειραματικά δεδομένα που περιέχουν  150 δορυφορικές εικόνες GaoFen-2 (GF-2). Επιπλέον, η ακρίβεια των εικονοστοιχείων (PA) και η μέση τομή μέσω της ένωσης (mIoU) χρησιμοποιήθηκαν για την αξιολόγηση της απόδοσης της προτεινόμενης μεθόδου και χρησιμοποιήθηκαν η ανάκληση, η τιμή F1 και ακρίβεια για την αξιολόγηση της επίδρασης της βελτίωσης του μοντέλου U-Net.

3.2. Καμπύλη απωλειών και ακρίβεια του δικτύου της διαδικασίας Training process

Όπως φαίνεται από το Γράφημα 3, με την αύξηση του αριθμού των training epochs,της ακρίβειας της διαδικασίας deep learning και την τιμή απώλειας να παραμένει σταδιακά σταθερή, το βελτιωμένο μοντέλο U-Net τείνει σταδιακά να συγκλίνει. Λαμβάνοντας τα δεδομένα δοκιμής ως παράδειγμα, η ακρίβεια και η τιμή απώλειας του βελτιωμένου μοντέλου U-Net είναι περίπου 93% και 0,1, αντίστοιχα, γεγονός που εξασφαλίζει καλύτερη απόδοση ταξινόμησης.

3.3. Σύγκριση διαφορετικών μεθόδων

                                                                                                                                                                         Για δύο ομάδες εικόνων, τα αποτελέσματα διαχωρισμού/τμηματοποίησης των διαφορετικών μεθόδων φαίνονται στο Γράφημα 4. Από αριστερά προς τα δεξιά είναι η αρχική εικόνα, η label εικόνα, το αποτέλεσμα τμηματοποίησης των Shao et al. (H.Shao et al.,2020), το αποτέλεσμα τμηματοποίησης των Lei et al.(R.Lei et al.,2021), και το αποτέλεσμα τμηματοποίησης της προτεινόμενης μεθόδου, στην οποία η περιοχή του πλαισίου είναι η επιλεγμένη περιοχή λεπτομερειών. Σε σύγκριση με τις μεθόδους στο (H.Shao et al.,2020;R.Lei et al.,2021), η προτεινόμενη μέθοδος έχει το καλύτερο αποτέλεσμα τμηματοποίησης. Η μέθοδος αυτή μπορεί να ενσωματώσει καλύτερα μεγάλης κλίμακας πληροφορίες, επομένως το αποτέλεσμα  τμηματοποίησης είναι το καλύτερο. Ομοίως, ο χάρτης τμηματοποίησης στα δεξιά του γραφήματος  4 δείχνει ότι η προτεινόμενη μέθοδος είναι ιδανική για την τμηματοποίηση των κατοικήσιμων αλλά και των γεωργικών εκτάσεων. Η προτεινόμενη μέθοδος υιοθετείται το βελτιωμένο μοντέλο U-Net, αποκτά καλύτερη ικανότητα εξαγωγής στοιχείων και βελτιστοποιεί το μοντέλο δικτύου χρησιμοποιώντας την μέθοδο Batch normalization  και την ενεργοποίηση της λειτουργίας  SeLU, έτσι ώστε να ληφθούν πιο καλά αποτελέσματα διαχωρισμού.                                                                                                                                                                                                                                                                                                                                                                                                                                                        3.4. Σύγκριση επιδόσεων διαφορετικών μοντέλων
                                                                                                                                                                                                 Η μέση ακρίβεια, η ανάκληση, η τιμή F1 και η συνολική ακρίβεια στο έργο του διαχωρισμού/ τμηματοποίησης της εικόνας τηλεπισκόπησης γης φαίνονται στο Γράφημα 5 και ως αποτέλεσμα της σύγκρισης των διαφόρων μεθόδων προκύπτει ότι  το προτεινόμενο βελτιωμένο μοντέλου U-Net είναι το καλύτερο και οι μέσες τιμές ακρίβειας, ανάκλησης, F1 και συνολικής ακρίβειας είναι περίπου 94,3%, 91,5%, 93,6% και 94,1%, αντίστοιχα. Η μέθοδος που προτείνεται σε αυτό το άρθρο υιοθετεί το βελτιωμένο U-Net για την απόκτηση πολυκαναλικών χαρακτηριστικών.                                                                                                                                                                                                                4. Συμπεράσματα    
                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                         Το έγγραφο αυτό προτείνει τη χρήση της βαθιάς μάθηση όπως το βελτιωμένο μοντέλο U-Net μέσω της κανονικοποίησης των παρτίδων batch  normalization , τη λειτουργία ενεργοποίησης SeLU και τη σύντηξη χαρακτηριστικών για την ταξινόμηση της χρήσης γης σε εικόνες τηλεπισκόπησης με στόχο την παρακολούθηση του αστικού και αγροτικού σχεδιασμού. Τα πειραματικά αποτελέσματα με βάση το TensorFlow δείχνουν ότι το βελτιωμένο μοντέλο U-Net υιοθετεί την αναβάθμιση του δείκτη ομαδοποίησης και τη σύνδεση παράλειψης για να επιτύχει καλύτερο αποτέλεσμα ταξινόμησης ενώ  προτείνεται  και η μέθοδος βελτιωμένου U-Net για διαχωρισμό/τμηματοποίηση εικόνας τηλεπισκόπησης. Η προτεινόμενη μέθοδος δεν κάνει τη δυναμική αλλαγή της χρήσης γης για αρκετά χρόνια. Στην επόμενη έρευνα, μπορούμε να προσπαθήσουμε να χρησιμοποιήσουμε την προτεινόμενη μέθοδο για να κάνουμε τη δυναμική αλλαγή όλων των αντικειμένων εδάφους σε μια συγκεκριμένη περιοχή ενώ μπορεί να είναι πιο ικανή στον εντοπισμό διαφόρων χαρακτηριστικών στην εικόνα.

@@ Γραμμή 4: / Γραμμή 4: @@
 [[Εικόνα: papagsfig1.4.png|thumb|right|'''Εικόνα 4''': Αποτελέσματα τμηματοποίησης εικόνας διαφορετικών μεθόδων.]]
 [[Εικόνα: papagsfig1.5.png|thumb|right|'''Εικόνα 5''': Σύγκριση αποτελεσμάτων τμηματοποίησης διαφορετικών μοντέλων. (α) Μέση τιμή της ακρίβειας, της ανάκλησης και των τιμών F1. (β) Συνολική ακρίβεια.]]
-'''ΜΕΘΟΔΟΣ ΤΑΞΙΝΟΜΗΣΗΣ ΧΡΗΣΕΩΝ ΓΗΣ ΤΩΝ ΕΙΚΟΝΩΝ ΔΟΡΥΦΟΡΙΚΗΣ ΤΗΛΕΠΙΣΚΟΠΗΣΗΣ ΓΙΑ ΤΗΝ ΠΑΡΑΚΟΛΟΥΘΗΣΗ ΤΟΥ ΑΣΤΙΚΟΥ & ΑΓΡΟΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ ΜΕ ΤΗΝ ΧΡΗΣΗ ΤΟΥ DEEP LEARNING.'''
+'''ΜΕΘΟΔΟΣ ΤΑΞΙΝΟΜΗΣΗΣ ΧΡΗΣΕΩΝ ΓΗΣ ΤΩΝ ΕΙΚΟΝΩΝ ΔΟΡΥΦΟΡΙΚΗΣ ΤΗΛΕΠΙΣΚΟΠΗΣΗΣ ΓΙΑ ΤΗΝ ΠΑΡΑΚΟΛΟΥΘΗΣΗ ΤΟΥ ΑΣΤΙΚΟΥ & ΑΓΡΟΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ ΜΕ ΤΗΝ ΧΡΗΣΗ ΤΟΥ DEEP LEARNING.'''
 '''ΤΙΤΛΟΣ:''' Land Use Classification Method of Remote Sensing Images for Urban and Rural Planning Monitoring Using Deep Learning
 '''ΣΥΓΓΡΑΦΕΙΣ:'''  1Xiaoling Xie,1Xueqin Kang,1Lei Yan,1Liqin Zeng,1and Lin Ye1
 '''ΠΗΓΗ:''' https://www.hindawi.com/journals/sp/2022/8381189/
 '''1.Εισαγωγή '''                                                                                                                                                                                                                                                                             Η κάλυψη γης είναι ένα σύμπλεγμα διαφόρων στοιχείων της επιφάνειας που καλύπτεται από φυσικά περιβαλλοντικά είδη και τεχνικά έργα. Τα τελευταία χρόνια χρησιμοποιώντας  την τηλεπισκόπηση, η λήψη εικόνων υψηλής ανάλυσης για την ταξινόμηση και  τη μελέτη της επιφάνειας δεν συμβάλλει μόνο στην προστασία του περιβάλλοντος αλλά και στη σταθερή βελτίωση της εθνικής οικονομίας και στην υγιή ανάπτυξη των αστικών και αγροτικών περιοχών(O.Charfi Marrakchi et al.,2021). Το deep learning είναι ένας πολύ αποτελεσματικός αλγόριθμος μάθησης, ο οποίος ξεπερνά την ακρίβεια των παραδοσιακών αλγορίθμων και είναι η κύρια κατεύθυνση της μελλοντικής έρευνας στον τομέα της τηλεπισκόπησης (O.Youme et al.,2021). Ως εκ τούτου, αυτό το έγγραφο προτείνει μια μέθοδο ταξινόμησης χρήσης γης του αστικού και αγροτικού σχεδιασμού που παρακολουθεί εικόνες τηλεπισκόπησης χρησιμοποιώντας το deep learning
-. Μοντέλο ταξινόμησης βασισμένο σε βελτιωμένο U-Net                                                                                                                                             2.1. Περιγραφή προβλήματος
+'''2. Μοντέλο ταξινόμησης βασισμένο σε βελτιωμένο U-Net                                                                                                                                             2.1. Περιγραφή προβλήματος'''
-  Σήμερα, σε πολλά ανώριμα πεδία, όπως ο σημασιολογικός διαχωρισμός/ τμηματοποίηση μιας  εικόνας τηλεπισκόπησης, είναι δύσκολο να ληφθεί ένα επίπεδο δεδομένων με καλό σημασιολογικό σχολιασμό (M.M.Hasan et al.,2021). Επομένως, ο τρόπος εκπαίδευσης ενός καλού μοντέλου διαχωρισμού/τμηματοποίησης σε ένα μικρό δείγμα συνόλου δεδομένων εικόνας τηλεπισκόπησης είναι το επίκεντρο των ερευνητών(S.Noppitak and O. Surinta,2021). Προκειμένου να επιλυθούν τα παραπάνω προβλήματα, προτείνεται ένα βελτιωμένο μοντέλο νευρωνικού δικτύου σε αυτό το έγγραφο.                                                                                                                                                                                                                                          '''2.2. Βελτιωμένο μοντέλο U-Net                                                                                                                                                                                2.2.1. Βασικό μοντέλο U-Net'''                                                                                                                                                                                     Το βασικό μοντέλο U-Net έχει τυπική δομή κωδικοποιητή-αποκωδικοποιητή, όπως φαίνεται στο Σχήμα 1. Η βασική αρχιτεκτονική U-Net έχει πέντε επίπεδα και το συνολικό δίκτυο είναι σε συμμετρική δομή. Στα αριστερά υπάρχει μια τυπική δομή νευρωνικού δικτύου (neural network structure) ενώ στη δεξιά πλευρά, πραγματοποιείται πρώτα η διαδικασία της επαναδειγματοληψίας(upsampling) και το μέγεθος του πυρήνα συνέλιξης(convolution kernel) είναι 2x2. Η συνέλιξη και η επαναδειγματοληψία σε αυτήν τη διαδικασία πρέπει να χρησιμοποιούν τη λειτουργία ενεργοποίησης της διορθωμένης γραμμικής μονάδας (ReLU) όπου χρησιμοποιείται το στρώμα U-Net.
-'''2.2.2. Βελτιωμένο μοντέλο U-Net  '''                                                                                                                                                                   Η συνολική συμμετρική δομή του δικτύου αποτελείται κυρίως από δύο μέρη: τον κωδικοποιητή στο αριστερό μισό του διαγράμματος και τον αποκωδικοποιητή στο δεξί μισό του Γραφήματος 2. Το U-Net υιοθετεί τη μέθοδο της υπέρθεσης καναλιών για συρραφή και σύντηξη χαρακτηριστικών, δηλαδή, προκειμένου να βελτιωθεί περαιτέρω η ακρίβεια διαχωρισμού/τμηματοποίησης, το U-Net στοιβάζει τα χαρακτηριστικά που εξάγονται κατά τη διαδικασία κωδικοποίησης με την αντίστοιχη διαδικασία αποκωδικοποίησης (H. Wei et al.,2020;P.Zhang and S. Hu,2019).Αυτή η μέθοδος μπορεί όχι μόνο να διατηρήσει στο μέγιστο βαθμό τα χαρακτηριστικά γνωρίσματα κατά τη διαδικασία μείωσης του δειγματοληπτικού ρυθμού (downsampling)  πληροφορίες χαρακτηριστικών στη διαδικασία μείωσης δειγματοληψίας στο μέγιστο βαθμό, αλλά και να κάνει το δίκτυο να περιέχει τόσο σημασιολογικά χαρακτηριστικά υψηλού επιπέδου όσο και χαρακτηριστικά λεπτομέρειας χαμηλού επιπέδου κατά τη διαδικασία επαναδειγματοληψίας (upsampling). Επιπλέον, το U-Net έχει μια μοναδική "συμμετρική δομή σχήματος U", η οποία ευνοεί την κατάτμηση της λεπτής εικόνας.
-                                                                                                                                                                                                                  '''2.3. Στρατηγική Βελτιστοποίησης του Μοντέλου Δικτύου                                                                                                                                        2.3.1. Ομαλοποίηση των τεχνιτών νευρωνικών δικτύων(batch normalization) . '''
-                                                                                                                                                                            Η έννοια του batch normalization προτάθηκε από την Google το 2015. Κατά τη διάρκεια της διαδικασίας διαδικασίας αυτής , οι παράμετροι του μοντέλου αλλάζουν συνεχώς και η κατανομή των δεδομένων εισόδου σε κάθε επίπεδο αλλάζει επίσης με αποτέλεσμα να δημιουργούνται πολλά προβλήματα (J.Hu, D et al.,2019; S. Shen et al.,2019). Η πρόταση της batch normalization μπορεί να δώσει λύση ενώ χωρίζεται σε 2 βήματα: την ομαλοποίηση και τον μετασχηματισμό.
-                                                                                                                                          '''2.3.2. Ενεργοποίηση λειτουργίας SeLU. '''
-                                                                                                                                                         Το SeLU μπορεί να ομαλοποιήσει αυτόματα την κατανομή του δείγματος με μέσο όρο 0 και τη μοναδιαία διακύμανση  αφού ενεργοποιηθεί η λειτουργία (W.Xiao et al.,2019). Η αυτο-κανονικοποίηση διασφαλίζει ότι η κλίση δεν θα αποκλίνει ή θα μηδενιστεί και το αποτέλεσμα είναι καλύτερο από την ομαλοποίηση των τεχνιτών νευρωνικών δικτύων(batch normalization) . Οι λειτουργίες ενεργοποίησης όπως το ReLU χρησιμοποιούνται στην περίπτωση που η κλίση του αρνητικού μισού άξονα είναι ήπια αλλά η θετική κλίση του μισού άξονα είναι απλά ορισμένη ως 1.
-                                                                                                                                                                                                                      '''3. Πείραμα και ανάλυση'''
-                                                                                                                                                                                                                                                Το πείραμα βασίζεται στο λειτουργικό σύστημα Ubuntu 16.04 LTS και χρησιμοποιεί το πλαίσιο μεθόδου deep learning TensorFlow για να δημιουργήσει ένα βελτιωμένο μοντέλο U-Net.
-'''                                                                                                                                                                                                                  3.1. Σύνολο δεδομένων και δείκτης αξιολόγησης '''
-                                                                                                                                                                                  Πέντε είδη δημόσιων δεδομένων από τηλεπισκοπικές εικόνες GID χρησιμοποιούνται ως πειραματικά δεδομένα που περιέχουν  150 δορυφορικές εικόνες GaoFen-2 (GF-2). Επιπλέον, η ακρίβεια των εικονοστοιχείων (PA) και η μέση τομή μέσω της ένωσης (mIoU) χρησιμοποιήθηκαν για την αξιολόγηση της απόδοσης της προτεινόμενης μεθόδου και χρησιμοποιήθηκαν η ανάκληση, η τιμή F1 και ακρίβεια για την αξιολόγηση της επίδρασης της βελτίωσης του μοντέλου U-Net.
+Σήμερα, σε πολλά ανώριμα πεδία, όπως ο σημασιολογικός διαχωρισμός/ τμηματοποίηση μιας  εικόνας τηλεπισκόπησης, είναι δύσκολο να ληφθεί ένα επίπεδο δεδομένων με καλό σημασιολογικό σχολιασμό (M.M.Hasan et al.,2021). Επομένως, ο τρόπος εκπαίδευσης ενός καλού μοντέλου διαχωρισμού/τμηματοποίησης σε ένα μικρό δείγμα συνόλου δεδομένων εικόνας τηλεπισκόπησης είναι το επίκεντρο των ερευνητών(S.Noppitak and O. Surinta,2021). Προκειμένου να επιλυθούν τα παραπάνω προβλήματα, προτείνεται ένα βελτιωμένο μοντέλο νευρωνικού δικτύου σε αυτό το έγγραφο.                                                                                                                                                                                                                                          '''2.2. Βελτιωμένο μοντέλο U-Net                                                                                                                                                                                2.2.1. Βασικό μοντέλο U-Net'''
+                                                                                                                                                                            Το βασικό μοντέλο U-Net έχει τυπική δομή κωδικοποιητή-αποκωδικοποιητή, όπως φαίνεται στο Σχήμα 1. Η βασική αρχιτεκτονική U-Net έχει πέντε επίπεδα και το συνολικό δίκτυο είναι σε συμμετρική δομή. Στα αριστερά υπάρχει μια τυπική δομή νευρωνικού δικτύου (neural network structure) ενώ στη δεξιά πλευρά, πραγματοποιείται πρώτα η διαδικασία της επαναδειγματοληψίας(upsampling) και το μέγεθος του πυρήνα συνέλιξης(convolution kernel) είναι 2x2. Η συνέλιξη και η επαναδειγματοληψία σε αυτήν τη διαδικασία πρέπει να χρησιμοποιούν τη λειτουργία ενεργοποίησης της διορθωμένης γραμμικής μονάδας (ReLU) όπου χρησιμοποιείται το στρώμα U-Net.
+'''2.2.2. Βελτιωμένο μοντέλο U-Net  '''
+                                                                                                                                                             Η συνολική συμμετρική δομή του δικτύου αποτελείται κυρίως από δύο μέρη: τον κωδικοποιητή στο αριστερό μισό του διαγράμματος και τον αποκωδικοποιητή στο δεξί μισό του Γραφήματος 2. Το U-Net υιοθετεί τη μέθοδο της υπέρθεσης καναλιών για συρραφή και σύντηξη χαρακτηριστικών, δηλαδή, προκειμένου να βελτιωθεί περαιτέρω η ακρίβεια διαχωρισμού/τμηματοποίησης, το U-Net στοιβάζει τα χαρακτηριστικά που εξάγονται κατά τη διαδικασία κωδικοποίησης με την αντίστοιχη διαδικασία αποκωδικοποίησης (H. Wei et al.,2020;P.Zhang and S. Hu,2019).Αυτή η μέθοδος μπορεί όχι μόνο να διατηρήσει στο μέγιστο βαθμό τα χαρακτηριστικά γνωρίσματα κατά τη διαδικασία μείωσης του δειγματοληπτικού ρυθμού (downsampling)  πληροφορίες χαρακτηριστικών στη διαδικασία μείωσης δειγματοληψίας στο μέγιστο βαθμό, αλλά και να κάνει το δίκτυο να περιέχει τόσο σημασιολογικά χαρακτηριστικά υψηλού επιπέδου όσο και χαρακτηριστικά λεπτομέρειας χαμηλού επιπέδου κατά τη διαδικασία επαναδειγματοληψίας (upsampling). Επιπλέον, το U-Net έχει μια μοναδική "συμμετρική δομή σχήματος U", η οποία ευνοεί την κατάτμηση της λεπτής εικόνας.                                                                                                                                                                                                                        '''2.3. Στρατηγική Βελτιστοποίησης του Μοντέλου Δικτύου                                                                                                                                        2.3.1. Ομαλοποίηση των τεχνιτών νευρωνικών δικτύων(batch normalization) . '''
+                                                                                                                                                                            Η έννοια του batch normalization προτάθηκε από την Google το 2015. Κατά τη διάρκεια της διαδικασίας διαδικασίας αυτής , οι παράμετροι του μοντέλου αλλάζουν συνεχώς και η κατανομή των δεδομένων εισόδου σε κάθε επίπεδο αλλάζει επίσης με αποτέλεσμα να δημιουργούνται πολλά προβλήματα (J.Hu, D et al.,2019; S. Shen et al.,2019). Η πρόταση της batch normalization μπορεί να δώσει λύση ενώ χωρίζεται σε 2 βήματα: την ομαλοποίηση και τον μετασχηματισμό.                                                                                                                                            '''2.3.2. Ενεργοποίηση λειτουργίας SeLU. '''
+                                                                                                                                                         Το SeLU μπορεί να ομαλοποιήσει αυτόματα την κατανομή του δείγματος με μέσο όρο 0 και τη μοναδιαία διακύμανση  αφού ενεργοποιηθεί η λειτουργία (W.Xiao et al.,2019). Η αυτο-κανονικοποίηση διασφαλίζει ότι η κλίση δεν θα αποκλίνει ή θα μηδενιστεί και το αποτέλεσμα είναι καλύτερο από την ομαλοποίηση των τεχνιτών νευρωνικών δικτύων(batch normalization) . Οι λειτουργίες ενεργοποίησης όπως το ReLU χρησιμοποιούνται στην περίπτωση που η κλίση του αρνητικού μισού άξονα είναι ήπια αλλά η θετική κλίση του μισού άξονα είναι απλά ορισμένη ως 1.                                                                                                                                                                                                                            '''3. Πείραμα και ανάλυση'''
+                                                                                                                                                                                                                                                Το πείραμα βασίζεται στο λειτουργικό σύστημα Ubuntu 16.04 LTS και χρησιμοποιεί το πλαίσιο μεθόδου deep learning TensorFlow για να δημιουργήσει ένα βελτιωμένο μοντέλο U-Net.                                                                                                                                                                                                                '''3.1. Σύνολο δεδομένων και δείκτης αξιολόγησης '''
+                                                                                                                                                                                  Πέντε είδη δημόσιων δεδομένων από τηλεπισκοπικές εικόνες GID χρησιμοποιούνται ως πειραματικά δεδομένα που περιέχουν  150 δορυφορικές εικόνες GaoFen-2 (GF-2). Επιπλέον, η ακρίβεια των εικονοστοιχείων (PA) και η μέση τομή μέσω της ένωσης (mIoU) χρησιμοποιήθηκαν για την αξιολόγηση της απόδοσης της προτεινόμενης μεθόδου και χρησιμοποιήθηκαν η ανάκληση, η τιμή F1 και ακρίβεια για την αξιολόγηση της επίδρασης της βελτίωσης του μοντέλου U-Net.
 '''3.2. Καμπύλη απωλειών και ακρίβεια του δικτύου της διαδικασίας Training process'''
   Όπως φαίνεται από το Γράφημα 3, με την αύξηση του αριθμού των training epochs,της ακρίβειας της διαδικασίας deep learning και την τιμή απώλειας να παραμένει σταδιακά σταθερή, το βελτιωμένο μοντέλο U-Net τείνει σταδιακά να συγκλίνει. Λαμβάνοντας τα δεδομένα δοκιμής ως παράδειγμα, η ακρίβεια και η τιμή απώλειας του βελτιωμένου μοντέλου U-Net είναι περίπου 93% και 0,1, αντίστοιχα, γεγονός που εξασφαλίζει καλύτερη απόδοση ταξινόμησης.
 '''3.3. Σύγκριση διαφορετικών μεθόδων  '''
-                                                                                                                                                                           Για δύο ομάδες εικόνων, τα αποτελέσματα διαχωρισμού/τμηματοποίησης των διαφορετικών μεθόδων φαίνονται στο Γράφημα 4. Από αριστερά προς τα δεξιά είναι η αρχική εικόνα, η label εικόνα, το αποτέλεσμα τμηματοποίησης των Shao et al. (H.Shao et al.,2020), το αποτέλεσμα τμηματοποίησης των Lei et al.(R.Lei et al.,2021), και το αποτέλεσμα τμηματοποίησης της προτεινόμενης μεθόδου, στην οποία η περιοχή του πλαισίου είναι η επιλεγμένη περιοχή λεπτομερειών. Σε σύγκριση με τις μεθόδους στο (H.Shao et al.,2020;R.Lei et al.,2021), η προτεινόμενη μέθοδος έχει το καλύτερο αποτέλεσμα τμηματοποίησης. Η μέθοδος αυτή μπορεί να ενσωματώσει καλύτερα μεγάλης κλίμακας πληροφορίες, επομένως το αποτέλεσμα  τμηματοποίησης είναι το καλύτερο. Ομοίως, ο χάρτης τμηματοποίησης στα δεξιά του γραφήματος  4 δείχνει ότι η προτεινόμενη μέθοδος είναι ιδανική για την τμηματοποίηση των κατοικήσιμων αλλά και των γεωργικών εκτάσεων. Η προτεινόμενη μέθοδος υιοθετείται το βελτιωμένο μοντέλο U-Net, αποκτά καλύτερη ικανότητα εξαγωγής στοιχείων και βελτιστοποιεί το μοντέλο δικτύου χρησιμοποιώντας την μέθοδο Batch normalization  και την ενεργοποίηση της λειτουργίας  SeLU, έτσι ώστε να ληφθούν πιο καλά αποτελέσματα διαχωρισμού.
+                                                                                                                                                                           Για δύο ομάδες εικόνων, τα αποτελέσματα διαχωρισμού/τμηματοποίησης των διαφορετικών μεθόδων φαίνονται στο Γράφημα 4. Από αριστερά προς τα δεξιά είναι η αρχική εικόνα, η label εικόνα, το αποτέλεσμα τμηματοποίησης των Shao et al. (H.Shao et al.,2020), το αποτέλεσμα τμηματοποίησης των Lei et al.(R.Lei et al.,2021), και το αποτέλεσμα τμηματοποίησης της προτεινόμενης μεθόδου, στην οποία η περιοχή του πλαισίου είναι η επιλεγμένη περιοχή λεπτομερειών. Σε σύγκριση με τις μεθόδους στο (H.Shao et al.,2020;R.Lei et al.,2021), η προτεινόμενη μέθοδος έχει το καλύτερο αποτέλεσμα τμηματοποίησης. Η μέθοδος αυτή μπορεί να ενσωματώσει καλύτερα μεγάλης κλίμακας πληροφορίες, επομένως το αποτέλεσμα  τμηματοποίησης είναι το καλύτερο. Ομοίως, ο χάρτης τμηματοποίησης στα δεξιά του γραφήματος  4 δείχνει ότι η προτεινόμενη μέθοδος είναι ιδανική για την τμηματοποίηση των κατοικήσιμων αλλά και των γεωργικών εκτάσεων. Η προτεινόμενη μέθοδος υιοθετείται το βελτιωμένο μοντέλο U-Net, αποκτά καλύτερη ικανότητα εξαγωγής στοιχείων και βελτιστοποιεί το μοντέλο δικτύου χρησιμοποιώντας την μέθοδο Batch normalization  και την ενεργοποίηση της λειτουργίας  SeLU, έτσι ώστε να ληφθούν πιο καλά αποτελέσματα διαχωρισμού.                                                                                                                                                                                                                                                                                                                                                                                                                                                        '''3.4. Σύγκριση επιδόσεων διαφορετικών μοντέλων'''
-                                                                                                                                                                                                                                                                                                                                                                                                                                                      '''3.4. Σύγκριση επιδόσεων διαφορετικών μοντέλων'''
+                                                                                                                                                                                                   Η μέση ακρίβεια, η ανάκληση, η τιμή F1 και η συνολική ακρίβεια στο έργο του διαχωρισμού/ τμηματοποίησης της εικόνας τηλεπισκόπησης γης φαίνονται στο Γράφημα 5 και ως αποτέλεσμα της σύγκρισης των διαφόρων μεθόδων προκύπτει ότι  το προτεινόμενο βελτιωμένο μοντέλου U-Net είναι το καλύτερο και οι μέσες τιμές ακρίβειας, ανάκλησης, F1 και συνολικής ακρίβειας είναι περίπου 94,3%, 91,5%, 93,6% και 94,1%, αντίστοιχα. Η μέθοδος που προτείνεται σε αυτό το άρθρο υιοθετεί το βελτιωμένο U-Net για την απόκτηση πολυκαναλικών χαρακτηριστικών.                                                                                                                                                                                                                '''4. Συμπεράσματα '''
-                                                                                                                                                                                                   Η μέση ακρίβεια, η ανάκληση, η τιμή F1 και η συνολική ακρίβεια στο έργο του διαχωρισμού/ τμηματοποίησης της εικόνας τηλεπισκόπησης γης φαίνονται στο Γράφημα 5 και ως αποτέλεσμα της σύγκρισης των διαφόρων μεθόδων προκύπτει ότι  το προτεινόμενο βελτιωμένο μοντέλου U-Net είναι το καλύτερο και οι μέσες τιμές ακρίβειας, ανάκλησης, F1 και συνολικής ακρίβειας είναι περίπου 94,3%, 91,5%, 93,6% και 94,1%, αντίστοιχα. Η μέθοδος που προτείνεται σε αυτό το άρθρο υιοθετεί το βελτιωμένο U-Net για την απόκτηση πολυκαναλικών χαρακτηριστικών.
+                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                          Το έγγραφο αυτό προτείνει τη χρήση της βαθιάς μάθηση όπως το βελτιωμένο μοντέλο U-Net μέσω της κανονικοποίησης των παρτίδων batch  normalization , τη λειτουργία ενεργοποίησης SeLU και τη σύντηξη χαρακτηριστικών για την ταξινόμηση της χρήσης γης σε εικόνες τηλεπισκόπησης με στόχο την παρακολούθηση του αστικού και αγροτικού σχεδιασμού. Τα πειραματικά αποτελέσματα με βάση το TensorFlow δείχνουν ότι το βελτιωμένο μοντέλο U-Net υιοθετεί την αναβάθμιση του δείκτη ομαδοποίησης και τη σύνδεση παράλειψης για να επιτύχει καλύτερο αποτέλεσμα ταξινόμησης ενώ  προτείνεται  και η μέθοδος βελτιωμένου U-Net για διαχωρισμό/τμηματοποίηση εικόνας τηλεπισκόπησης. Η προτεινόμενη μέθοδος δεν κάνει τη δυναμική αλλαγή της χρήσης γης για αρκετά χρόνια. Στην επόμενη έρευνα, μπορούμε να προσπαθήσουμε να χρησιμοποιήσουμε την προτεινόμενη μέθοδο για να κάνουμε τη δυναμική αλλαγή όλων των αντικειμένων εδάφους σε μια συγκεκριμένη περιοχή ενώ μπορεί να είναι πιο ικανή στον εντοπισμό διαφόρων χαρακτηριστικών στην εικόνα.
-                                                                                                                                                                                                                '''4. Συμπεράσματα '''                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                             Το έγγραφο αυτό προτείνει τη χρήση της βαθιάς μάθηση όπως το βελτιωμένο μοντέλο U-Net μέσω της κανονικοποίησης των παρτίδων batch  normalization , τη λειτουργία ενεργοποίησης SeLU και τη σύντηξη χαρακτηριστικών για την ταξινόμηση της χρήσης γης σε εικόνες τηλεπισκόπησης με στόχο την παρακολούθηση του αστικού και αγροτικού σχεδιασμού. Τα πειραματικά αποτελέσματα με βάση το TensorFlow δείχνουν ότι το βελτιωμένο μοντέλο U-Net υιοθετεί την αναβάθμιση του δείκτη ομαδοποίησης και τη σύνδεση παράλειψης για να επιτύχει καλύτερο αποτέλεσμα ταξινόμησης ενώ  προτείνεται  και η μέθοδος βελτιωμένου U-Net για διαχωρισμό/τμηματοποίηση εικόνας τηλεπισκόπησης. Η προτεινόμενη μέθοδος δεν κάνει τη δυναμική αλλαγή της χρήσης γης για αρκετά χρόνια. Στην επόμενη έρευνα, μπορούμε να προσπαθήσουμε να χρησιμοποιήσουμε την προτεινόμενη μέθοδο για να κάνουμε τη δυναμική αλλαγή όλων των αντικειμένων εδάφους σε μια συγκεκριμένη περιοχή ενώ μπορεί να είναι πιο ικανή στον εντοπισμό διαφόρων χαρακτηριστικών στην εικόνα.

Land Use Classification Method of Remote Sensing Images for Urban and Rural Planning Monitoring Using Deep Learning

Από RemoteSensing Wiki

Αναθεώρηση της 15:40, 14 Μαρτίου 2023

Εμφανίσεις

Προσωπικά εργαλεία

Πλοήγηση

Αναζήτηση

Εργαλεία