Κοκκομετρική σύσταση εδαφών με την βοήθεια νευρωνικών δικτύων

Από RemoteSensing Wiki

Έκδοση στις 14:38, 17 Φεβρουαρίου 2010 υπό τον/την Paulkefalas1 (Συζήτηση | Συνεισφορές/Προσθήκες)
Μετάβαση σε: πλοήγηση, αναζήτηση

Κοκκομετρική σύσταση εδαφών με την βοήθεια νευρωνικών δικτύων Συγγραφείς : Yushun Zhai, J. Alex Thomasson, Julian Boggess, Ruixiu Sui

  Για τη επεξεργασία μεγάλης ποσότητας δεδομένων στην τηλεπισκόπηση απαιτούνται ικανές και ‘έξυπνες’ τεχνικές. Η ταξινόμηση μέσω εικόνων, καθώς και η εξαγωγή χαρακτηριστικών είναι πολύ σημαντικές στην ταξινόμηση εδαφών από αεροφωτογραφία η από δορυφορική εικόνα. Τεχνολογίες τεχνητής νοημοσύνης καθώς και τεχνικά νευρωνικά δίκτυα(Artificial Neural Network) βοηθούν σε μεγάλο βαθμό την επεξεργασία των δεδομένων κατά την διαδικασία ταξινόμησης. Τα συστήματα ΑΝΝ είναι κυρίως σχεδιασμένες σαν μηχανές αναγνώρισης, που στις οποίες το κύριο βασικό στοιχείο είναι το ‘ neuron’ ή ‘ node’. Τα συγκεκριμένα συστήματα χαρακτηρίζονται από την υψηλή ταχύτητα επεξεργασίας δεδομένων, και είναι ικανά να επεξεργάζονται μεγάλες ποσότητες δεδομένων. Οι οι συνεργαζόμενοι μεταξύ τους εξασκούμενοι αλγόριθμοι, όπως η προσωτροφοδότηση και η οπισθοδρόμηση είναι ικανά να εξάγουν σημαντικά χαρακτηριστικά από θορυβώδη δεδομένα.

Για να είναι αποτελεσματικά τα συστήματα ΑΝΝ θα πρέπει να γίνει αρχικά μια προεπεξεργασία. Πολλές φορές όμως είναι δύσκολο να υπάρξει μόνο ένα μοντέλο η ένας ικανοποιητικός ταξινομητής (ANN). Το πρόβλημα αυτό μπορεί να λυθεί με την χρήση ενός αριθμού ταξινομητών οι οποίοι θα στηρίζονται σε μοντέλα που θα συνεργάζονται μεταξύ τους.H μέθοδος του συνδυασμού διαφορετικών ταξινομητών ονομάστηκε “committee machines” (CM) που προέρχονται από προσωπικούς ταξινομητές ΑΝΝ.

  Η περιοχή μελέτης αποτελούνταν από δύο χωράφια(αποκαλούμενα 1 και 3 ) στην περιοχή Vence του Mississippi,  στο βόρειο τμήμα του δέλτα του πόταμου Mississippi. Τον Ιούλιο του 1999, συλλέχτηκαν 274 και 443 εδαφικά δείγματα από τα ανώτερα 15 εκατοστά του εδαφικού προφίλ, στα χωράφια 1 και 3. Οι γεωγραφικές συντεταγμένες των σημείων δειγματοληψίας, καταγράφηκαν με την συσκευή Satloc XLS GPS και διορθώθηκαν με σφάλμα 1μέτρου με το σύστημα Omnistar correction data. Η κοκκομετρική σύσταση των δειγμάτων υπολογίστηκε με την μέθοδο του υδρόμετρου, το οποίο υπολογίζει το ποσοστό της αργίλου, της ιλύος και της άμμου. Στην συνέχεια τα δείγματα χωρίστηκαν σε κατηγορίες ανάλογα με την περιεκτικότητα τους σε άργιλο και άμμο. Για την μείωση του αριθμού των δειγμάτων ανά κατηγορία και της άνισης κατανομής τα δείγματα ταξινομήθηκαν σε 3 βασικές εδαφικές κατηγορίες, ονομαζόμενες ως πηλώδης, αργιλοπηλώδης και αργιλώδης
  Στην παρούσα έρευνα χρησιμοποιήθηκαν 2 εικόνες Landsat χωρικής ανάλυσης 120 x 120 στο κανάλι 6 και 30x30 στα άλλα. Το λογισμικό Erdas χρησιμοποιήθηκε για να γίνει η ταυτοποίηση το κυψελών (pixels) με τα σημεία που πάρθηκαν τα δείγματα, μέσω των συντεταγμένων τους. Στα συγκεκριμένα pixels μετά τον φασματικό προσδιορισμό τους στα 7 κανάλια του Landsat, έγινε διεύρυνση, καθώς κάθε ένα από αυτά επεκτάθηκε κατά 1 κυψέλη προς κάθε κατεύθυνση. Αυτό είχε ως αποτέλεσμα την δημιουργία “παραθύρων” 3x3 pixel. Η δημιουργία τέτοιων παραθύρων έγινε για όλα τα κανάλια με αποτέλεσμα να προκύψουν 63 ιδιοχαρακτηριστικά που σχετίζονταν με τις κατηγορίες κοκκομετρικής σύστασης του εδάφους. Στα δεδομένα φασματικής ακτινοβόλου λαμπρότητας έγινε μια προεπεξεργασία προτού αποτελέσουν δεδομένα εισαγωγής για τα συστήματα ΑΝΝ. Αρχικά όλες οι τιμές όλων των καναλιών χωρίστηκαν ανάλογα ε την φασματική λαμπρότητα του στο κανάλι 2 με αποτέλεσμα ο αριθμός των δεδομένων να μειωθεί σε 54. Έπειτα όλες οι τιμές των κυψελών διαιρέθηκαν με το 4, που αποτελούσε την μεγαλύτερη τιμή των δεδομένων, με αποτέλεσμα όλες οι τιμές να κυμαίνονται μεταξύ του 0 και1.
  Σαν πηγή φασματικών δεδομένων χρησιμοποιήθηκαν και αεροφωτογραφίες που είχαν υψηλότερη χωρική ανάλυση (1x1). Το παράθυρο των κυψελών διευρύνθηκε κατά 5 pixels προς κάθε κατεύθυνση με αποτέλεσμα 4 υποκατηγοριών 25, 49, 81 και 120 μόνοκάναλες κυψέλες για κάθε σημείο δειγματοληψίας, και όλες οι τιμές των κυψελών διαιρέθηκαν με το 255 καθώς αποτελούσε την μέγιστη τιμή αυτών των δεδομένων.
  Τα συστήματα ΑΝΝ , στα αποτελέσματα τους, έχουν συνήθως παραπάνω από ένα κόμβο .Ένας ειδικευμένος CM (SCM) που αποτελείται από εξειδικευμένα συστήματα ΑΝΝ δίνει συνήθως σαν αποτέλεσμα ένα κόμβο. Για τον λόγο αυτό o SCM χρησιμοποιείται σε προβλήματα με που απατούν ταξινόμηση σε παραπάνω από μία κατηγορίες 
  Μέσω της κατάρτισης και των δοκιμών των συστημάτων ΑΝΝ δημιουργούνται 3 κατηγορίες δεδομένων . Η πρώτη κατηγορία περιλαμβάνει τα αρχικά δεδομένα των εδαφικών δειγμάτων και στις 2 υποκατηγορίες. Στην δεύτερη κατηγορία γίνεται η εξίσωση του αριθμού των δεδομένων στις 3 κατηγορίες κοκκομετρικής σύστασης, στην υποκατηγορία τη κατάρτισης, ενώ την υποκατηγορία των δοκιμών παραμένουν τα ίδια. Η τρίτη κατηγορία χωρίζεται σε 3 υποκατηγορίες. Αυτές προέκυψαν μέσω της διπλής αντιγραφής των υποκατηγοριών της κατάρτισης της δεύτερης κατηγορίας, ενώ οι υποκατηγορίες δοκιμών προέκυψαν απο τον διαχωρισμό των αντίστοιχων υποκατηγοριών 
  Κατά την ταξινόμηση τα ECs χρησιμοποιήθηκαν σε παραπάνω από ένα χαρακτηριστικά με αποτέλεσμα την δημιουργία τριών κόμβων για τις τρείς κατηγορίες κοκκομετρικής σύστασης, ενώ αντίστοιχα κατά την χρήση των SECs είχε ως αποτέλεσμα την ταξινόμηση ενός μόνο χαρακτηριστικού για την καθεμία κατηγορία. Και για τους δύο τύπους ΑΝΝ τα πιθανά αποτελέσματα ήταν 0 (ψευδές) η 1(αληθές). Για την εικόνες Landsat οι εισροές ήταν 54 κόμβοι που αναπαριστούσαν 54 τιμές φασματικής ακτινοβόλου λαμπρότητας, καθώς και 3 παραγόμενους κόμβους που αντιστοιχούσαν στις τρείς κατηγορίες κοκκομετρικής σύστασης. Για κάθε κατηγορία δεδομένων χρησιμοποιήθηκαν 9 ECs και 9 SECs πάνω στα ίδια δεδομένα αλλά με διαφορετική βαρύτητα. Για τις αεροφωτογραφίες ο αριθμός των εισερχόμενων κόμβων ήταν ανάλογος με το μέγεθος της κυψέλης που χρησιμοποιούταν.
  Καθώς γίνεται η κατάρτιση των ταξινομητών ΑΝΝ, δύο πράγματα θα πρέπει να λαμβάνονται υπόψη:

1) πως θα πρέπει να οργανώνονται τα εισερχόμενα δεδομένα που χρησιμοποιούνται κατά την κατάρτιση και την δοκιμή, 2)πότε θα πρέπει να σταματήσει η διαδικασία κατάρτισης και με ποιο κριτήριο Κυρίως δύο κριτήριο χρησιμοποιούνται για την κατάρτιση των ANN. Το πρώτο αναφέρεται στην κατάρτιση των ταξινομητών ΑΝΝ για ένα συγκριμένο αριθμό “εποχών” για την αποφυγή ο ταξινομητής ΑΝΝ να είναι πολύ εξειδικευμένος η πολύ γενικός, ενώ το δεύτερο κριτήριο αναφέρεται στην μέθοδο αντεπικύρωσης, οπού σχετίζεται ελάχιστο μέσο τετραγωνικό σφάλμα σε σχέση με την υποκατηγορία κατάρτισης. Στη υποκατηγορία κατάρτισης υπάρχει ένα υποσύνολο που συγκρατεί το πλήθος των διαφορετικών αριθμών κατά την διάρκεια μιας “εποχής”. Ο βέλτιστος αριθμός “εποχών” ταυτίζεται με το ελάχιστο μέσο τετραγωνικό σφάλμα.

  Τα αποτελέσματα για τις εικόνες Landsat παρουσιάζουν ότι τα συστήματα SCM έχουν καλύτερα αποτελέσματα ανεξάρτητα την μέθοδο συνδυασμού ταξινομητών που εφαρμόστηκε  : μέσου όρου, σταθμισμένου μέσου όρου, ειδικής πλειοψηφίας. Αυτό σημαίνει ότι τα συστήματα SCM έχουν γενικά πλεονεκτήματα σε σύγκριση με τα συστήματα SCM καθώς και την ικανότητα εστίασης ενός εξειδικευμένου προγράμματος. Ωστόσο και τα δύο συστήματα δεν είχαν τα ίδια ικανοποιητικά αποτελέσματα στον αγρό, σε σύγκριση με αντίστοιχα τα οποία είχαν αρχικά καταρτιστεί. Τα αποτελέσματα για τις αεροφωτογραφίες ήταν παρόμοια με αυτά των εικόνων Landsat. To σύστημα SCM είχα καλυτέρα αποτελέσματα από το CM, καθώς και η απόδοση και των δύο συστημάτων ήταν πολύ καλύτερη όταν οι υποκατηγορίες
Προσωπικά εργαλεία