Μεθοδολογία Μηχανικής Μάθησης για τον Προσδιορισμό Κατάλληλων Ορεινών Πεζοπορικών Προορισμών μέσω GIS και Τηλεπισκόπησης

Από RemoteSensing Wiki

Μετάβαση σε: πλοήγηση, αναζήτηση

Μεθοδολογία Μηχανικής Μάθησης για τον Προσδιορισμό Κατάλληλων Ορεινών Πεζοπορικών Προορισμών μέσω GIS και Τηλεπισκόπησης

Πρωτότυπος τίτλος: Machine Learning Approach to Identify Promising Mountain Hiking Destinations Using GIS and Remote Sensing

Συγγραφείς: Lahbib Naimi, Charaf Ouaddi, Lamya Benaddi, El Mahi Bouziane, Abdeslam Jakimi, Mohamed Manaouch

Δημοσιεύθηκε: International Journal of Advanced Computer Science and Applications(IJACSA), Volume 15 Issue 10, 2024

Σύνδεσμος πρωτότυπου κειμένου: [1]


Σκοπός της εργασίας

Η παρούσα εργασία στοχεύει στον εντοπισμό και τη χαρτογράφηση δυνητικά κατάλληλων ορεινών περιοχών για υπαίθριες δραστηριότητες, όπως είναι η πεζοπορία και η ορειβασία, σε περιοχή του Μαρόκο. Συγκεκριμένα, μέσα από την αξιοποίηση των τεχνικών της μηχανικής μάθησης και των γεωγραφικών δεδομένων επιδιώκεται η ανάλυση βασικών τοπογραφικών παραμέτρων με σκοπό την ανάπτυξη ενός αξιόπιστου μοντέλου που να προβλέπει τον βιώσιμο τουριστικό σχεδιασμό της περιοχής.


Περιοχή μελέτης

Η μελέτη αφορά την περιοχή του Άτλαντα στη βορειοδυτική Αφρική, η οροσειρά του οποίου εκτείνεται από το Μαρόκο και την Αλγερία έως την Τυνησία. Συγκεκριμένα, δίνεται έμφαση στην ανατολική ζώνη του Υψηλού Άτλαντα στο νοτιοανατολικό Μαρόκο, όπου επικρατεί κλίμα που χαρακτηρίζεται από κρύους χειμώνες και ξηρά καλοκαίρια με χαμηλή βροχόπτωση (περίπου 119 έως 377 mm ετησίως) και θερμοκρασίες που κυμαίνονται από 10.2 έως 19.2°C. Επιπλέον, στην περιοχή συναντάμε υψόμετρα από 1023 έως 3687m.

Εικόνα 1: Περιοχή μελέτης: Ανατολικός Υψηλός Άτλαντας στο Μαρόκο.

Μεθοδολογία

Η διεξαγωγή της μελέτης πραγματοποιήθηκε μέσα από ορισμένη μεθοδολογία, η οποία θα μπορούσε να διαχωριστεί στα παρακάτω στάδια:

Στάδιο 1ο : Συλλογή δεδομένων

Τα δεδομένα που χρησιμοποιήθηκαν συλλέχθηκαν από επιτόπιες έρευνες, γεωλογικούς χάρτες, Google Earth images και δορυφορικές εικόνες από τον Landsat 8 OLI. Για τη διεξαγωγή της έρευνας πραγματοποιήθηκαν εκτεταμένες επισκέψεις στο σημείο ενδιαφέροντος εντοπίζοντας και μοντελοποιώντας 120 περιοχές πεζοπορικού ενδιαφέροντος. Επίσης εξετάστηκε ίσος αριθμός περιοχών που δεν πληρούν τα κριτήρια ορεινής πεζοπορίας επιδιώκοντας μια ισορροπημένη προσέγγιση. Περαιτέρω, οι βασικοί παράγοντες ελέγχου για την ορεινή πεζοπορία (Mountain Hiking Conditioning Factors – MHCFs), όπως η κλίση, το μήκος κλίσης και το υψόμετρο, που λειτουργούν ως ανεξάρτητες μεταβλητές, προσδιορίζονται και ενσωματώνονται στη μελέτη, καθώς διαδραματίζουν καθοριστικό ρόλο στον προσδιορισμό της καταλληλότητας των περιοχών πεζοπορίας. Ακόμα, δημιουργείται χάρτης καταγραφής, ο οποίος περιλαμβάνει τις 240 επιλεγμένες θέσεις και λειτουργεί ως σύνολο αναφοράς για τη διαδικασία αξιολόγησης. Από το σύνολο των δεδομένων χρησιμοποιήθηκε το 70% για εκπαίδευση και το 30% για επαλήθευση, ενώ η επεξεργασία των δεδομένων πραγματοποιήθηκε με τη χρήση των λογισμικών ArcGIS 10.5 και SPSS Statistics 26, τα οποία επέτρεψαν τη μετατροπή των γεωχωρικών δεδομένων σε μορφή πινάκων. Η διαδικασία περιλαμβάνει επίσης τον υπολογισμό λόγων συχνότητας, την κανονικοποίηση των δεδομένων, την ανάλυση χωρικών συσχετίσεων και την προετοιμασία των επιμέρους θεματικών επιπέδων, διασφαλίζοντας ότι τα δεδομένα είναι πλήρως κατάλληλα για την τελική ανάλυση. Τέλος, η επαλήθευση του μοντέλου πραγματοποιήθηκε με τη χρήση της καμπύλης ROC και του εμβαδού κάτω από αυτή (Area Under the Curve – AUC), μιας ευρέως χρησιμοποιούμενης μεθόδου σε μελέτες γεωχωρικής μοντελοποίησης για την αξιολόγηση της αξιοπιστίας των μοντέλων.

Εικόνα 2: Χάρτης απεικόνισης περιοχών ορεινής πεζοπορίας που επιλέχθηκαν για τη μοντελοποίηση.

Στάδιο 2ο : Αξιολόγηση μοντέλου

Η αξιολόγηση του μοντέλου γίνεται με τη χρήση της καμπύλης ROC και του εμβαδού κάτω από αυτή (Area Under Curve). Οι δείκτες αυτοί καθορίζουν την αποτελεσματικότητα του μοντέλου και παρέχουν αξιόπιστα αποτελέσματα προκειμένου να διασφαλιστεί η καταλληλότητα μιας περιοχής για ορεινή πεζοπορία.

Α. Αναφορικά με τους δείκτες καταλληλότητας ορεινής πεζοπορίας (MHCFs) παρουσιάζονται οι χάρτες για κάθε έναν από αυτούς:

1. Υψόμετρο (Elevation): για τη μέτρηση του υψομέτρου χρησιμοποιούνται ευρέως τοπογραφικές μέθοδοι αποτύπωσης, δορυφορικά συστήματα προσδιορισμού θέσης (π.χ. GPS), καθώς και τεχνικές τηλεπισκόπησης, όπως το LiDAR ή τα ραντάρ.

Εικόνα 3: Υψόμετρο – Παράγοντας Καταλληλότητας Ορεινής Πεζοπορίας (MHCFs).


2. Κλίση (Slope): Η κλίση υπολογίζεται στο ArcGIS με βάση τη μεταβολή του υψομέτρου μεταξύ γειτονικών κελιών ενός ψηφιακού μοντέλου εδάφους (Digital Elevation Model – DEM) σε μορφή raster. Ο μαθηματικός τύπος υπολογισμού της κλίσης δίνεται από τη σχέση: Κλίση(%) = (rise/run)*100.

Εικόνα 4: Κλίση εδάφους – Παράγοντας Καταλληλότητας Ορεινής Πεζοπορίας (MHCFs).

3. Μήκος κλίσης (LS – Length of Slope): Ο συγκεκριμένος δείκτης προκύπτει από το ψηφιακό μοντέλο εδάφους μέσα από το λογισμικό του ArcGIS και ακολουθώντας τον τύπο των Wischmeier και Smith: LS = ((L/22)^m)×(65.41〖sin⁡〗^2 (S)+4.56sin⁡(S)+0.065) όπου:

- L είναι το μήκος της κλίσης, - S είναι η κλίση της επιφάνειας (εκφρασμένη ως ποσοστό), - m είναι σταθερά που μεταβάλλεται ανάλογα με το εύρος των κλίσεων.

Εικόνα 5: Χάρτης Παραγόντων Καταλληλότητας Ορεινής Πεζοπορίας (MHCFs): Μήκος κλίσης.


Β. Αλγόριθμος μηχανικής μάθησης και λόγος συχνότητας (FR)

1. Για τη συγκεκριμένη μελέτη χρησιμοποιείται ο αλγόριθμος Bagging καθώς έχει την ικανότητα να αυξάνει τη σταθερότητα σε γεωχωρικά δεδομένα. Η λειτουργία του βασίζεται στην δημιουργία συνόλων εκπαίδευσης από τα αρχικά δεδομένα, μέσα από τυχαία επιλογή δειγμάτων με επανάθεση (Bootstrapping), με σκοπό την επανάληψη ή τον αποκλεισμό κάποιων παρατηρήσεων. Στη συνέχεια, με τα παραγόμενα αποτελέσματα του bootstrapping κατασκευάζονται μοντέλα που εκπαιδεύονται ανεξάρτητα ώστε να αποτυπώνουν διαφορετικά χαρακτηριστικά των δεδομένων κάθε φορά. Οι τελικές προβλέψεις προκύπτουν από τον συμψηφισμό (aggregating) των αποτελεσμάτων των επιμέρους μοντέλων.

2. Frequency Ratio Method: χρησιμοποιήθηκε για τη συσχέτιση των δεικτών καταλληλότητας περιοχών ορεινής πεζοπορίας με τη χωροθέτηση των περιοχών αυτών, με σκοπό να εντοπιστούν οι ευνοϊκότερες τοποθεσίες για την ανάπτυξη της δραστηριότητας αυτής. Όσο μεγαλύτερος είναι αυτός ο λόγος, τόσο μεγαλύτερη πιθανότητα έχουμε για κατάλληλες περιοχές εντός της γεωγραφικής κατηγορίας.

Γ. Απόδοση του αλγορίθμου μέσα από την καμπύλη ROC/AUC

Η ανάλυση της καμπύλης βασίστηκε στις 120 περιοχές του χάρτη και τις δυνητικά κατάλληλες περιοχές για ορεινή πεζοπορία και περιλαμβάνει τιμές ανάμεσα στο 0 και 1, όπου εάν η τιμή ισούται με 0,5 δεν παρουσιάζει διακριτική ικανότητα το μοντέλο , ενώ εάν ισουται με 1 τότε παρουσιάζει τέλεια διακριτική ικανότητα. Μέσα από τον υπολογισμό των δεικτών TP, TN, FP, FN επιτρέποντας την εκτίμηση του συμβιβασμού μεταξύ ευαισθησίας και ειδικότητας. Η τιμή AUC που είναι περίπου 0,93 δείχνει υψηλή απόδοση και αξιοπιστία του μοντέλου. Η καμπύλη ROC παρέχει οπτική απεικόνιση της απόδοσης και βοηθά στην επιλογή του βέλτιστου κατωφλίου για την ταξινόμηση των περιοχών με βάση τις απαιτήσεις της μελέτης.

Δ. Συσχέτιση Περιοχών Ορεινής Πεζοπορίας με Παράγοντες Καταλληλότητας

Η μελέτη ανέλυσε τη σχέση μεταξύ των περιοχών ορεινής πεζοπορίας και τριών παραγόντων καταλληλότητας χρησιμοποιώντας τον λόγο συχνότητας (Frequency Ratio – FR), με τιμές κανονικοποιημένες μεταξύ 0,1 και 0,9 για να δείξουν τη δύναμη της συσχέτισης. Οι υψηλότερες τιμές υποδηλώνουν ισχυρότερη συσχέτιση μεταξύ των περιοχών πεζοπορίας και του αντίστοιχου παράγοντα. Βάσει αυτής της ανάλυσης, ο Bagging χρησιμοποιήθηκε για τη δημιουργία χάρτη καταλληλότητας ορεινής πεζοπορίας, ο οποίος δείχνει ότι οι βόρειες και δυτικές περιοχές της μελετώμενης ζώνης είναι οι πλέον κατάλληλες για δυνητικές διαδρομές. Για την καλύτερη κατανόηση των παραγόντων που επηρεάζουν την καταλληλότητα ή μη των περιοχών, τα αποτελέσματα αξιολογήθηκαν με τη συμβολή τοπικών ειδικών και επαληθεύτηκαν με εικόνες από το Google Earth. Ο χάρτης παρέχει επίσης τα ποσοστά κάλυψης κάθε κατηγορίας καταλληλότητας, προσφέροντας σαφή απεικόνιση της χωρικής κατανομής των δυνητικών περιοχών πεζοπορίας.

Εικόνα 6: Κατάλληλες περιοχές για ορεινή πεζοπορία με βάση τον αλγόριθμο bagging.


Αποτελέσματα

Η απόδοση των μοντέλων μηχανικής μάθησης μπορεί να διαφέρει ανάλογα με τον αλγόριθμο που χρησιμοποιείται. Στη μελέτη αυτή, η απόδοση του Bagging αξιολογήθηκε με τη μέθοδο 10-fold cross-validation κατά τη φάση εκπαίδευσης, παρουσιάζοντας υψηλή ακρίβεια με τιμή AUC 0,97, ενώ στη φάση επικύρωσης η απόδοση μειώθηκε σε 0,93. Η υψηλή τιμή AUC υποδηλώνει ικανοποιητική προβλεπτική ικανότητα και αξιοπιστία του μοντέλου, παρά τη μικρότερη απόδοση σε σχέση με άλλες εφαρμογές όπως η πρόβλεψη περιοχών αναδασώσεων. Επιπλέον, η αξιολόγηση της καταλληλότητας των περιοχών για ορεινή πεζοπορία απαιτεί να ληφθούν υπόψη και ποιοτικοί παράγοντες πέρα από τα ποσοτικά αποτελέσματα του μοντέλου, όπως οι πολιτισμικές συνθήκες, η εμπλοκή της τοπικής κοινότητας, η ύπαρξη υποδομών πρόσβασης και σήμανσης, καθώς και η ασφάλεια και ευκολία χρήσης των διαδρομών. Περιοχές με υψηλή οικολογική ή αισθητική αξία αλλά χωρίς επαρκείς υποδομές ενδέχεται να είναι λιγότερο κατάλληλες σε σύγκριση με περιοχές που διαθέτουν καλύτερη υποστήριξη για πεζοπόρους. Η ανάλυση με τον Bagging δημιούργησε χάρτη καταλληλότητας ορεινής πεζοπορίας για την περιοχή του Άνω Ζίζ, κατηγοριοποιώντας τις περιοχές σε ακατάλληλες, κατάλληλες και πολύ κατάλληλες. Περίπου το 24% της μελετώμενης περιοχής χαρακτηρίζεται ως πολύ κατάλληλο, κυρίως στα βόρεια και δυτικά ορεινά τμήματα και κατά μήκος του φαραγγιού του Ζίζ, ενώ τα νότια θεωρούνται ακατάλληλα. Παρά τα ενθαρρυντικά αποτελέσματα, περιορισμοί όπως η ποιότητα των δεδομένων και η έλλειψη ορισμένων παραγόντων (μικροκλίμα, τύποι βλάστησης, ανθρώπινες επιδράσεις) μπορεί να επηρεάσουν την ακρίβεια του μοντέλου.

Εικόνα 7: Καμπύλη ρυθμού πρόβλεψης για τον χάρτη καταλληλότητας ορεινής πεζοπορίας που προέκυψε με τη μέθοδο Bagging.


Συμπεράσματα

Η μελέτη έδειξε ότι η ενσωμάτωση τοπογραφικών δεδομένων με τον αλγόριθμο Bagging αποτελεί αποτελεσματικό εργαλείο για την αναγνώριση κατάλληλων περιοχών ορεινής πεζοπορίας στην περιοχή του Άνω Ζίζ, με περίπου 24% της περιοχής να χαρακτηρίζεται πολύ κατάλληλη, κυρίως στα βόρεια, δυτικά και κατά μήκος του Ζίζ φαραγγιού. Η αξιολόγηση με την καμπύλη AUC/ROC (93%) επιβεβαίωσε την ακρίβεια και αξιοπιστία του μοντέλου, υποστηρίζοντας τεκμηριωμένες αποφάσεις για την τουριστική ανάπτυξη. Τα αποτελέσματα αναδεικνύουν τη σημασία των τεχνικών μηχανικής μάθησης στον σχεδιασμό βιώσιμου τουρισμού και προτείνουν μελλοντικές επεκτάσεις, όπως η ενσωμάτωση οικολογικών και κοινωνικο-οικονομικών δεδομένων, η συνεργασία με τοπικές κοινότητες και η εφαρμογή της μεθοδολογίας σε άλλες περιοχές για την υποστήριξη της ανάπτυξης οικοτουρισμού.

Προσωπικά εργαλεία