Μια τεχνική φιλτραρίσματος για το σημείο ενδιαφέροντος προκειμένου να βελτιωθεί η επαναληπτικότητα και η εμπεριεχόμενη πληροφορία

Από RemoteSensing Wiki

Μετάβαση σε: πλοήγηση, αναζήτηση


Μια τεχνική φιλτραρίσματος για το σημείο ενδιαφέροντος προκειμένου να βελτιωθεί η επαναληπτικότητα και η εμπεριεχόμενη πληροφορία
Πρωτότυπος τίτλος : A Filtering Strategy for Interest Point Detecting to Improve Repeatability and Information Content.Πηγή : Qing Zhu, Bo Wu, and Neng Wan, Photogrammetric Engineering & Remote Sensing Vol. 73, No. 5, May 2007, pp. 547–553. [6]

<b>Περίληψη


Η εξαγωγή των χαρακτηριστικών γνωρισμάτων παίζει σημαντικό ρόλο στον τομέα της αντιστοίχησης των εικόνων, της περιγραφής των αντικειμένων, στην εκτίμηση της μετακίνησης και στην παρακολούθηση των αντικειμένων στο χώρο. Τα σημεία ενδιαφέροντος είναι τα απαραίτητα στοιχεία μιας εικόνας αφού ένα σημείο ενδιαφέροντος αφορά ένα οποιοδήποτε διακριτό σημείο στην εικόνα όπου το σήμα αλλάζει βάσει δύο διαστάσεων. Στην ανάλυση της εικόνας και στην στερεοσκοπική παρατήρηση, είναι ιδιαίτερα σημαντική η επιλογή ενός ανιχνευτή-σημείου ενδιαφέροντος για να εξετάσει τις διαφορετικές απαιτήσεις της εφαρμογής. Με σκοπό τη στερεοσκοπική αντιστοίχηση των εικόνων και την επόμενη τρισδιάστατη αναδημιουργία, εξετάστηκε λεπτομερώς στο παρελθόν κατά την επιλογή ενός ανιχνευτή-σημείου ενδιαφέροντος η ακρίβεια ανίχνευσης της αποδοτικότητας και της θέσης. O Schmid et all (2000), επισήμαναν ότι η επιλογή ενός ανιχνευτή σημείου ενδιαφέροντος πρέπει να βασιστεί στο περιεχόμενό της επαναληπτικότητας και των πληροφοριών που περιλαμβάνει. (Περισσότερες πληροφορίες σχετικά με την επαναληπτικότητα και τις εμπεριεχόμενες πληροφορίες θα βρείτε εδώ:http://www.lsgi.polyu.edu.hk/staff/Bo.Wu/publications/zhu&wu07_pe&rs_filtering.pdf).Η επαναληπτικότητα των σημείων ενδιαφέροντος καθορίζει την αξιοπιστία της αντιστοιχίας, ενώ το περιεχόμενο των πληροφοριών δείχνει τη σημασία των σημείων ενδιαφέροντος στην τρισδιάστατη αναδημιουργία του αντικειμένου. Στις δορυφορικές εικόνες και στις αεροφωτογραφίες μεγάλης κλίμακας, πολλά σημεία χαμηλού ενδιαφέροντος μπορούν να εντοπιστούν από τον ανιχνευτή Harris σε εικόνες με χαμηλή υφή και μερικά σημαντικά σημεία με χαμηλό ενδιαφέρον μειώνουν την επαναληπτικότητα και το περιεχόμενο των πληροφοριών ενώ αυξάνει τη πιθανότητα κακής αντιστοιχίας και μειώνει την αποδοτικότητα της αντιστοιχίας της επόμενης εικόνας. Παρότι μερικές βελτιωμένες μέθοδοι του ανιχνευτή Harris όπως αυτή των Mikolajczk και Schmid (2004)προτείνονται για να ενισχύσουν τη σταθερότητά του στην κλίμακα και να καθαρίσει τους μετασχηματισμούς, η ανίχνευση των ενδιαφερόντων σημείων με καλή επαναληπτικότητα και πληροφορία για τη στερεοσκοπική αντιστοιχία και τη τρισδιάστατη αναδημιουργία δεν μελετάται λεπτομερώς. Αυτό το έγγραφο προτείνει μια μέθοδο φιλτραρίσματος σχετική με τα τοπικά χαρακτηριστικά γνωρίσματα της υφής της εικόνας για να διαλέξει εκείνα τα σημεία που θα μειώσουν το γενικό περιεχόμενο επανάληπτικότητας και πληροφοριών. Αυτή η μέθοδος λαμβάνει υπόψη και τη δύναμη ενδιαφέροντος και συγχρόνως το τοπικό χαρακτηριστικό γνώρισμα του σημείου ενδιαφέροντος. Παρουσιάζεται μια διατύπωση φιλτραρίσματος για να υπολογίσει την απάντηση κάθε pixel και έπειτα ένα κατώτατο όριο σχεδιάζεται για επιλογή των σημείων ενδιαφέροντος. Αυτό το έγγραφο έχει δύο συνεισφορές. Κατ' αρχάς, περιγράφονται οι έννοιες της επαναληπτικότητας και του περιεχομένου της πληροφορίας όπως εφαρμόζεται στην ανίχνευση του σημείου ενδιαφέροντος του στερεοζεύγους, και στο επόμενο μέρος συγκρίνει αρκετούς χαρακτηριστικούς ανιχνευτές, οι οποίοι περιλαμβάνουν τις παραδοσιακές και ενημερωμένες μεθόδους, και παρουσιάζουν τα αποτελέσματα σύγκρισης στο περιεχόμενο επανάληψης και πληροφοριών χρησιμοποιώντας τις τυποποιημένες εικόνες δοκιμής. Η δεύτερη συμβολή είναι με τη χρησιμοποίηση του χαρακτηριστικού γνωρίσματος ανάλυσης της εικόνας βασισμένη στην εντροπία των πληροφοριών όπου μια μέθοδος φιλτραρίσματος επιλέγει τα σημεία ενδιαφέροντος σχετικά με το τοπικό χαρακτηριστικό γνώρισμα εικόνας.

Τηλεπισκοπικά δεδομένα

Στη μελέτη αυτή, χρησιμοποιούνται τρία στερεοζεύγη εικόνων, των οποίων κάποιες ιδιότητες είναι ίδιες, το μέγεθός τους είναι 1000x1000 pixels, η κλίμακα είναι 1:10.000, η επικάλυψη είναι 65%, αλλά διαφέρουν σημαντικά στην πολυπλοκότητα υφής. Τα πειράματα πραγματοποιούνται σε αυτά τα στερεοζεύγη για να συγκριθούν με τους ανιχνευτές Moravec, Förstner, Harris, τη μέθοδο DOG, τον ανιχνευτή Harris-Laplace, για να αναλυθεί η επαναληπτικότητα και το περιεχόμενο της πληροφορίας των εξαγώμενων σημείων ενδιαφέροντος. Στα πειράματα αυτά, το όριο της παραμέτρου του ανιχνευτή Moravec και Förstner έχουν επιλεγεί σύμφωνα με τις τιμές που έχουν συστηθεί από τον Moravec (1977) και Förstner (1994) και είναι οι εξής: η παράμετρος σ του Gaussian weight template in Harris είναι 0.5, a equal to 0.04, και η μάσκα φιλτραρίσματος είναι 5x5. Όσον αφορά τη μέθοδο DOG (difference-of-Gaussian), συμμετέχουν δύο οκτάδες, με τέσσερις επιλεγμένες κλίμακες σε κάθε οκτάδα. Ο απλουστευμένος αλγόριθμος Mikolajczk and Schmid (2004) χρησιμοποιείται για να ολοκληρώσει τον ανιχνευτή Ηarris-Laplace.

Μεθοδολογία

Τα σημεία ενδιαφέροντος που είναι ανιχνευμένα από τον ανιχνευτή Harris-Laplace μπορούν να φιλτραριστούν χρησιμοποιώντας το μέγεθος της δύναμης ενδιαφέροντος τους. Εντούτοις, δεν θα μελετηθεί λεπτομερώς ο αριθμός των σημείων ενδιφέροντος που παραλείπονται και η μέθοδος καλού καθορισμού σημείων. ενδιαφέροντος. Αυτό γίνεται αναγκαίο στις μεγάλες κλίμακες αεροφωτογραφιών ή δορυφορικών εικόνων που πρέπει να αντιστοιχηθούν. Η πληροφορία σχετικά με την εντορπία [7] γενικά χρησιμοποιείται στην κατανόηση και την ανάλυση της εικόνας. Οι Kadir and Brady (2001) χρησιμοποίησαν την πληροφορία αυτή για να πάρουν μια εμφανή περιοχή, ενώ αυτό το έγγραφο την χρησιμοποιεί για να περιγράψει το τοπικό χαρακτηριστικό γνώρισμα της εικόνας. Η διακριτική ικανότητα του σημείου ενδιαφέροντος δεν σχετίζεται μόνο με τη ισχύ του βάσει όλης της εικόνας αλλά και με τα τοπικά χαρακτηριστικά του σημείου. Έτσι χρησιμοποιείται μια στρατηγική πλέγματος για να χαρακτηριστεί αυτό το είδος των τοπικών χαρακτηριστικών. Για να σχεδιάσουμε ένα πλέγμα σε μια εικόνα με ρυθμισμένη ανάλυση, παίζει ρόλο η εντροπία η οποία και περιγράφει τα χαρακτηριστικά γνωρίσματα του κάθε κελιού του πλέγματος. Έτσι ολόκληρη η εικόνα έχει μετατραπεί σε ένα πίνακα εντροπιών όπου κάθε κελί του περιγράφει διφορετική εντροπία κι έτσι ο πίνακας περιγράφει όχι μόνο τα γενικά χαρακτηριστικά της εικόνας αλλά και τα τοπικά. (Περισσότερες πληροφορίες για το σχέδιο εισαγωγής της εντροπίας θα βρειτε εδώ: http://www.lsgi.polyu.edu.hk/staff/Bo.Wu/publications/zhu&wu07_pe&rs_filtering.pdf).

Εικόνα 1 :Παρουσίαση εικόνας σε αρχική μορφή, μορφή πλέγματος 30x40, ταξινομημένη εικόνα. [1]πηγή

Η Εικόνα 1a προβάλλεται σε ένα πλέγμα με ανάλυση 30x40 (εικόνα 1b), και υπολογίζεται έπειτα η εντροπία κάθε κελιού. Οι διαφορετικές γκρίζες τιμές χρησιμοποιούνται για να δείξουν τη διαφορά της εντροπίας των κελιών, όπου ο ανοιχτός τόνος αντιπροσωπεύει την υψηλή εντροπία, και ο σκούρος τόνος δείχνει τη μικρή εντροπία, δίνοντας μια ταξινομημένη ,βάσει των χαρακτηριστικών της, εικόνα (Eικ.1c). Από την Eικόνα 1c, η εντροπία του κάθε κελιού μπορεί να χρησιμοποιηθεί για να αναλύσει κατάλληλα τα χαρακτηριστικά των εικόνων. Όταν χρησιμοποιείται ένας πίνακας εντροπίας προκειμένου να αναλυθούν τα χαρακτηριστικά η ακρίβεια συσχετίζεται προφανώς με την ανάλυση του πλέγματος. Όσο μεγαλύτερη είναι η ανάλυση του πλέγματος, τόσο πιο ακριβή είναι τα χρακτηριστικά της εικόνας και επομένως η επεξεργασία των πινάκων εντροπίας θα ήταν πιό χρονοβόρα. Με δοκιμαστικές ενέργειες, αποδεικνύει ότι για μια εικόνα 256x256 pixel είναι κατάλληλα να χρησιμοποιηθούν τα κελιά πλέγματος 16x16 pixels. Μετά την ανάλυση τα χαρακτηριστικά της εικόνας χρησιμοποιώντας την τοπική εντροπία των κελιών μπορούμε να θεωρήσουμε όλα τα σημεία (pixels) σε ένα κελί ως το ίδιο τοπικό χαρακτηριστικό γνώρισμα. Στον ανιχνευτή Harris-Laplace, τα βασικό κριτήριο ανίχνευσης ενός σημείου ενδιαφέροντος είναι ότι η δύναμη αυτού του σημείου πρέπει να είναι η μέγιστη όλων των σημείων σε μια 5x5 (ή 3x3) μάσκα με το σημείο στο κέντρο της. Έτσι η σχετική με τα χαρακτηριστικά γνωρίσματα μέθοδος φίλτρων καθορίζεται ως εξής: <math>Εισαγωγή τύπου εδώ</math> , όπου το Ν είναι ο αριθμός των σημείων στο πίνακα της μάσκας και τοS[i] είναι η ισχύς του σημείου i υπολογίζοντας την εξίσωση 4 που θα βρέιτε εδώ:[8] Το F[i] είναι το τοπικό χαρακτηριστικό του σημείου i και το e και το Τ είναι σταθερές που καθορίζουν την ποικιλία των χαρακτηριστικών της εικόνας και των αριθμό των σημείων ενδιαφέροντος που έχουν επιλεγεί αντίστοιχα. Η σταθερά Τ σχετίζεται με το μέγεθος της μάσκας φιλτραρίσματος. Όταν το μέγεθος της μάσκας αυτής είναι 5x5 το Τ μπορεί να τεθεί στο [2,5], ενώ όταν πρόκειται για μέγεθος 3x3 τότε τίθεται στο [1,4] και έπειτα το ποσοστό μείωσης των σημείων ενδιαφέροντος είναι περίπου 25-50%. Η σταθερά e κυμένεται από 1-3 και σχετίζεται με την τοπική υφή της εικόνας, όσο πολυπλοκότερη η υφή της εικόνας τόσο μεγαλύτερη η αξία της. Οι τιμές των e και T είναι εμπειρικές τιμές που υπολογίζονται με βάση τα εκτενή πειράματα με τις διαφορετικές εικόνες, και μπορούν επίσης να καθοριστούν από τους χρήστες σύμφωνα με τις απαιτήσεις τους.

Εικόνα 2 :Εικόνες με τα σημεία ενδιαφέροντος από τον ανιχνευτή Harris-Laplace. [2]πηγή

Στην εικόνα 2 φαίνονται τα διαφορετικά αποτελέσματα της ανίχνευσης των σημείων ενδιφέροντος με τις διαφορετικές στρατηγικές. Η εικόνα 2a είναι η αναφορά της εικόνας, η 2b παρουσιάζει τα σημεία ενδιαφέροντος ανιχνευμένα από τον ανιχνευτή Harris-Laplace χωρίς να έχουν φιλτραριστεί (ο αριθμός των σημείων ενδιφέροντος είναι 4.993). Η εικόνα 2c παρουσιάζει τα σημεία ενδιφέροντος μετά το φιλτράρισμα λαμβάνοντας υπόψη το τοπικό χαρακτηριστικό γνώρισμα της εικόνας (Τ=3.5, e= 1.5). Ο αριθμός σημείων ενδιαφέροντος είναι 3.637, δηλ. σχεδόν το 1/3 των αρχικών σημείων με τη χαμηλότερη δύναμη φιλτραρίστηκαν. Ο αριθμός των εναπομένοντων σημείων ενδιαφέροντος σε περιοχές χαμηλής υφής (όπως στην περιοχή παιδικών χαρών και λιμνών που μαρκάρονται με έναν κύκλο και μια έλλειψη, αντίστοιχα, στον αριθμό 2b) είναι αντίστοιχα μικρός, αλλά στις περιοχές καλής υφής (κοντά στους δρόμους και τα κτίρια), υπάρχουν περισσότερα σημεία ενδιαφέροντος που παραμένουνν μετά το φιλτράρισμα.

Ανάλυση αποτελεσμάτων

Βάσει αυτής της στρατηγικής φιλτραρίσματος με τον ανιχνευτή Harris-Laplace αρκετά στερεοζεύγη της εικόνας (πίνακας 1 και εικόνα 3) αναλύονται, το στερεοζεύγος 5 μεταφορτώθηκε από τον επίσημο ιστοχώρο ISPRS [9].

Πίνακας 1 :Αποτελέσματα των πειραμάτων των στερεοζευγών. [3]πηγή


Εικόνα 3 :Στερεοζεύγη 5 και 6 της στρατηγικής φιλτραρίσματος. [4]πηγή

Το όριο της αξιοπιστίας της αντιστοιχίας τίθεται στο 0.8 ώστε να εξασφαλίσει μια υψηλή αντιστοιχία ποιότητας και το μέγεθος κελιού είναι 100 για τον υπολογισμό του περιεχομένου πληροφοριών. Αφού έχουν αντιστοιχιθεί όλα τα απιτούμενα σημεία μπορεί έπειτα να ληφθεί το DSMs και 46 σημεία ελέγχου για κάθε στερεοζεύγος, επιλέγονται από έναν ψηφιακό φωτογραμμομετρικό τερματικό σταθμό, το μεγαλύτερος μέρος του οποίου εντόπιζεται στο έδαφος και χρησιμοποιούνται για να υπολογίσουν το λάθος μέσης τετραγωνικής τιμής (RMSE) με την παρεμβολή των τιμών ανύψωσης αυτών των σημείων ελέγχου από το παραγόμενο DSM. Τα αποτελέσματα του ανιχνευτή Harris-Standard, της μεθόδου DOG και των Harris-Laplace συγκρίνονται και παρουσιάζονται στον Πίνακα2.

Πίνακας 2 :Αποτελέσματα πειραμάτων διαφορετικών ανιχνευτών. [5]πηγή

Από τα πειράματα, ο ανιχνευτής Harris-Laplace στρατηγική φιλτραρίσματος σχετική με τα χαρακτηριστικά γνωρίσματα δίνει καλύτερα αποτελέσματα από άλλους ανιχνευτές από άποψη επαναληπτικότητας και περιεχομένου πληροφοριών, όπως στο στερεοζεύγος 4, το οποίο καλύπτει μεγάλη δασική περιοχή χαμηλής υφής και σύστασης νερού, η επαναληπτικότητα αυξάνεται από 18.63% του ανιχνευτή Harris-Laplace σε 23.93% και στη indistinctive και ομοιογενή υφή του στερεοζεύγους 6, η επανάληπτικότητα και το περιεχόμενο πληροφοριών αυξάνονται από 2.318% του ανιχνευτή Harris-Laplace σε 25.79% και 3.108% αντίστοιχα. Η πυκνότητα των σημείων αντιστοιχίας, είναι προτιμότερο να παραγάγει DSMS επειδή το RMSE των σημείων ελέγχου του ανιχνευτή Harris-Laplace με το φιλτράρισμα είναι επίσης καλύτερο από αυτό του ανιχνευτή Harris-Laplace, καθώς επίσης και καλύτερα από άλλα.

Συμπεράσματα

Αυτό το άρθρο κατέληξε στα εξής συμπεράσματα: 1) Με σκοπό την αντιστοιχία του στερεοζεύγους και την τρισδιάστατη αναδημιουργία του αντικειμένου, η επαναληπτικότητα και το περιεχόμενο πληροφοριών είναι τα δύο σημαντικότερα κριτήρια κατά την αξιολόγηση των ανιχνευτών σημείου ενδιαφέροντος. 2)Ο ανιχνευτής Harris-Laplace αποδίδει καλύτερα στις πτυχές του περιεχομένου επαναληπτικότητας και πληροφοριών από άλλους ανιχνευτές στους τομείς της καλής υφής. 3)Ο ανιχνευτής Harris-Laplace με τη στρατηγική φιλτραρίσματος σχετικά με τα χαρακτηριστικά γνωρίσματα που παρουσιάζεται σε αυτό το έγγραφο όχι μόνο δίνει το καλύτερο περιεχόμενο επανάληπτικότητας και πληροφοριών από άλλους ανιχνευτές, αλλά είναι και καταλληλότερος για την αντιστοιχία στερεοζευγών εικόνας και για την επόμενη τρισδιάστατη αναδημιουργία.