Ανίχνευση οχημάτων σε δορυφορικές εικόνες πολύ υψηλής ανάλυσης από αστικές περιοχές

Από RemoteSensing Wiki

Μετάβαση σε: πλοήγηση, αναζήτηση

Πρωτότυπος Τίτλος: Vehicle detection in very high resolution satellite images of city areas.

Συγγραφείς: Jens Leitloff, Stevan Hinz, Uwe Stilla

Λέξεις Κλειδιά: Adaptive Boosting (AdaBoost), Εκτίμηση παραμέτρων, Δορυφορικές εικόνες, Ανίχνευση οχημάτων

Πηγή: IEEE Transactions on Geoscience and Remote Sensing, 2010, 48(7):2795-2806


Πίνακας περιεχομένων

Εισαγωγή

Μέχρι τώρα, η έρευνα κίνησης οχημάτων βασίζεται σε δεδομένα από αισθητήρες ήχου ή κάμερες. Το κακό είναι πως οι πηγές αυτές δεν παρέχουν πάντα δεδομένα ροής οχημάτων ή δεν είναι καν διαθέσιμα σε μεγάλος μέρος του οδικού δικτύου. Αντίθετα, οι σύγχρονες δορυφορικές εικόνες προσφέρουν εικόνες πολύ μεγάλης ανάλυσης, που μπορούν να προσφέρουν περισσότερα δεδομένα από τις παραδοσιακές πηγές. Μέσω της ανάλυσης αυτών των εικόνων και στατιστικών δεδομένων, είναι δυνατή η ανίχνευση και αναγνώριση οχημάτων καθώς και η ταχύτητά τους, με επιτυχία πάνω από 80%.

Μεθοδολογία

Εικόνα 1 Συνολική στρατηγική (τα ξεχωριστά βήματα διακρίνονται από τις διακεκομμένες γραμμές)
Εικόνα 2 Αποτέλεσμα διαδικασίας (i) σε εικόνα από τον QuickBird. Οι μαύρες γραμμές είναι οι δρόμοι και οι άσπρες γραμμές τα όριά τους

Η μελέτη βασίστηκες σε εικόνες υψηλής ανάλυσης από το δορυφορικό σύστημα QuickBird. Η προσέγγιση που ακολουθείται κατά τη επεξεργασία της δορυφορικής εικόνας, και παρουσιάζεται στο παρακάτω γράφημα (Εικόνα 1), είναι αρχικά (i) η ανίχνευση των σημείων ενδιαφέροντος και (ii) η εκμάθηση των αλγορίθμων αναγνώρισης οχημάτων, ειδικά του αλγορίθμου Gentle AdaBoost. Στη συνέχεια γίνεται ξεχωριστή επεξεργασία για (iii) ουρές αυτοκινήτων και (iv) ξεχωριστά αυτοκίνητα μέσα σε αυτές. Τα αποτελέσματα των παραπάνω διαδικασιών συνδυάζονται και παράγουν τα τελικά δεδομένα, αυξάνοντας την συνολική απόδοση και αξιοπιστία του συστήματος. Ένα επιπλέον χαρακτηριστικό του συστήματος είναι να εκτιμά τη δραστηριότητα των οχημάτων (v) και ειδικά την ταχύτητά τους.

(i) Ανίχνευση των σημείων ενδιαφέροντος

Το πρώτο στάδιο κατά την επεξεργασία των δορυφορικών εικόνων είναι να ανιχνευθούν τα σημεία ενδιαφέροντος, δηλαδή ποια τα όρια των δρόμων, των λεωφόρων, των γεφυρών κτλ. Τα δεδομένα αυτά υποτίθενται πως υπάρχουν για τις περισσότερες αναπτυγμένες χώρες. Για παράδειγμα η συγκεκριμένη μελέτη χρησιμοποιεί τα δεδομένα από το Γερμανικό Επίσημο σύστημα Τοπογραφικών και Χωροταξικών Πληροφοριών (ATKIS). Αρκετές φορές όμως περιέχουν λάθη ή είναι χαμηλής ανάλυσης, άρα χρειάζεται να επαναϋπολογιστούν πάνω στις δορυφορικές εικόνες του Quickbird (Εικόνα 2). Αυτή η διαδικασία είναι η μόνη όπου η αλληλεπίδραση του χρήστη είναι αναγκαία, αλλά θα μπορούσε να γίνει αυτόματη, αν υπήρχε μια -ακριβότερη- πολιτική εικόνων υψηλότερης ανάλυσης.

(ii) Εκμάθηση των αλγορίθμων αναγνώρισης οχημάτων

Το δεύτερο στάδιο είναι, ουσιαστικά, η εκμάθηση του συστήματος στο να αναγνωρίζει αυτοκίνητα σε μια εικόνα. Αυτό γίνεται από ένα σύνολο δειγμάτων, τα οποία έχουν ποικίλες αναλύσεις. Σε μεγάλο πλήθος δορυφορικών εικόνων οι λεπτομέρειες των οχημάτων δε φαίνονται, μιας και όσο υψηλή ανάλυση και αν παρέχεται, η απόσταση είναι τεράστια. Άρα ο αλγόριθμος Gentle AdaBoost, ο οποίος επιλέχθηκε λόγω της μεγαλύτερης ευαισθησίας που προσφέρει, αρχίζει να μαθαίνει τι είναι όχημα και τι όχι, βάση παραδειγμάτων. Κατά το στάδιο αυτό, χρησιμοποιήθηκαν πάνω από 900 αυτοκίνητα, σε διάφορες θέσεις, σε ένα σύνολο 10.000 εικόνων. Μετά από πειραματισμούς, καταλήξαμε πως το μέγεθος εικόνας ενός αυτοκινήτου, για να γίνει η πλέον ιδανική αναγνώρισή του είναι 13x13 pixels.

Εικόνα 3 Παράδειγμα μιας ουράς αυτοκινήτων. (α) Πρωτότυπη εικόνα με τονισμένο το επαναλαμβανόμενο μοτίβο και (β) θολή εικόνα με την κατάληξή της σε γραμμή
Εικόνα 4 Παραγωγή πολυγωνικού περιγράμματος ουράς αυτοκινήτων

(iii) Ανίχνευση ουρών αυτοκινήτων

Η συγκεκριμένη διαδικασία είναι αρκετά σημαντικά σε αστικά περιβάλλοντα λόγω της έντονης κίνησης, αλλά και των πολλών παρκαρισμένων αυτοκινήτων στις άκρες των δρόμων. Μια ουρά αυτοκινήτων είναι κάτι το ενιαίο και δε κατασκευάζεται απλά από πολλά αυτοκίνητα. Είναι μια οντότητα η οποία έχει επαρκές μήκος και συγκεκριμένο πλάτος, τα οποία είναι συναρτήσεις των αντίστοιχων μεγεθών ενός αυτοκινήτου, παρουσιάζει μικρή καμπυλότητα, έχει κάποιο επαναλαμβανόμενο μοτίβο στον κάθετο άξονα (Εικόνα 3α) και, αν τη δούμε σε μια πιο θολή εικόνα, θα πρέπει να καταλήγει σε μία γραμμή (Εικόνα 3β). Για να γίνει ακόμα αποδοτικότερη η αναγνώριση μιας ουράς αυτοκινήτων, τα περιγράμματα των ουρών που έχουν ανιχνευθεί καταλήγουν, μετά από γραμμική επεξεργασία και εξέταση της διεύθυνσης της ουράς, σε πολυγωνικές γραμμές (Εικόνα 4), οι οποίες βοηθάνε στο επόμενο βήμα, την αναγνώριση ξεχωριστών αυτοκίνητων μέσα σε αυτές.

(iv) Ανίχνευση αυτοκινήτων σε ουρά οχημάτων

Ένα από τα πιο πολύπλοκα σημεία του συστήματος είναι η αναγνώριση των οχημάτων μέσα σε μια ουρά. Σε αυτό το βήμα βοηθάνε οι Γκαουσιανές συναρτήσεις πυρήνα (Gaussian kernel) και για καλύτερη σύγκλιση αυτών χρησιμοποιείται ο αλγόριθμος Levelberg-Marquardt. Με απλά λόγια, σε αυτή τη διαδικασία τα οχήματα αναγνωρίζονται σε μια πολυγωνική γραμμή ουράς (βλ. μέρος iii) εξετάζοντας σε κάθε σημείο της το πλάτος και την αντίθεση του χρώματος που έχει από τα διπλανά pixels. Τα αποτελέσματα αυτά συνδυάζονται με τα αντίστοιχα αποτελέσματα για αυτοκίνητα εκτός ουράς, από τον αλγόριθμο AdaBoost (βλ. μέρος ii), ώστε να καταλήξουμε σε τελικές υποθέσεις του τι είναι αυτοκίνητο και τι όχι σε μια δορυφορική εικόνα πόλης.

Εικόνα 5
Εικόνα 6 Καθυστέρηση των δύο καναλιών: Αυθεντικές εικόνες (Διακεκομμένες γραμμές με τετράγωνα) και Προσεγγίσεις από Συνάρτηση πυρήνα Gauss (συμπαγείς γραμμές). Κανάλι Pan (πράσινες γραμμές) και κανάλι MS (κόκκινες γραμμές).

(v) Εκτίμηση της δραστηριότητας των οχημάτων

Αν και όλη η ανάλυση του συστήματος βασίζεται σε σταθερές εικόνες από το δορυφόρο, είναι δυνατή μια εκτίμηση της ταχύτητας των οχημάτων, βάση αυτών των εικόνων. Επειδή ο δορυφόρος Quickbird έχει διαφορετικούς οπτικούς άξονες για τα δύο κανάλια της εικόνας (PAN και MS), οι οποίοι δε συμπίπτουν, παρατηρείται μια καθυστέρηση 0,2 δευτερολέπτων στην ίδια εικόνα, ανάμεσα σε αυτά τα κανάλια (Εικόνα 6). Αυτό έχει ως αποτέλεσμα τη γνωστή θολούρα, που παρατηρούμε σε τέτοιες εικόνες (Εικόνα 5). Αυτό, αν και μέχρι τώρα το χαρακτηρίζουμε ενοχλητικό, μπορεί να οδηγήσει μετά από μαθηματική ανάλυση των δύο καναλιών σε μια εκτίμηση για τη ταχύτητα των ανιχνευμένων αυτοκινήτων. Βέβαια, αυτή η εκτίμηση μπορεί να γίνει μόνο σε οχήματα εκτός ουράς, γιατί σε αυτά αυτή η καθυστέρηση μεταξύ των δύο καναλιών είναι αρκετά μεγάλη για να μπορεί να γίνει κάποια ανάλυση. Στις δοκιμές που έγιναν, τέθηκε ως όριο τα 1,2 m για να επιβεβαιωθεί πως το όχημα κινείται. Αυτό αντιστοιχεί σε μια ταχύτητα 20 χλμ/ώρα, που είναι κάτω από τη τυπική ταχύτητα των οχημάτων σε μια πόλη, αλλά χάνεται η εκτίμηση της αργής κίνηση των οχημάτων, όπως π.χ. κατά τη διάρκεια μιας κυκλοφορικής συμφόρησης.



Αποτελέσματα

Το αρχικό σύνολο δεδομένων για τους ελέγχους του συστήματος είναι εικόνες του Μονάχου από το δορυφόρο Quickbird. Η Εικόνα 7 είναι ένα καλό παράδειγμα, που δείχνει αρκετές διαφορετικές καταστάσεις που μπορεί να αντιμετωπίσει το σύστημα, όπως ουρές αυτοκινήτων, ξεχωριστά αυτοκίνητα, αυτοκίνητα σε διασταυρώσεις, δέντρα, σκιές στο δρόμο κ.α. Τέτοιες μεμονωμένες καταστάσεις βλέπουμε στην Εικόνα 8.

Κατά το στάδιο της αρχικής αναγνώρισης οχημάτων, μέσω του αλγορίθμου ταξινόμησης AdaBoost (μέρος ii), παράγονται εικόνες όπως η Εικόνα 9. Ουσιαστικά σβήνονται όλα τα pixels της εικόνα, που δεν αποτελούν κάποιο όχημα, σύμφωνα με τον αλγόριθμο. Στη συνέχεια, γίνεται η γραμμική ανάλυση για την παραγωγή των πολυγωνικών γραμμών, που προαναφέρθηκαν στο μέρος iii (Εικόνα 10) και, τέλος, παράγονται οι τελικές εκτιμήσεις για το τι είναι όχημα και τι όχι στην αρχική εικόνα (Εικόνα 11).

Συνολικά, κατά το στάδιο των ελέγχων, το σύστημα κατάφερε και αναγνώρισε τα 221 από τα 268 αυτοκίνητα, που μετρήθηκαν χειρονακτικά, στην εικόνα 2. Αυτά τα αποτελέσματα έδειξαν 82,5% επιτυχία στην αναγνώριση των οχημάτων και 95,3% ορθότητα σε όσα οχήματα ανιχνεύτηκαν. Τα λάθη έχουν ως αίτια από τη μία την υψηλή πολυπλοκότητα των εικόνων σε μια πόλη, και από την άλλη τη χαμηλά ανάλυση αυτών. Στην Εικόνα 12 βλέπουμε τα συνολικά αποτελέσματα σε πιο μακροσκοπικό επίπεδο, σε δύο δρόμους ενός οικοδομικού τετραγώνου. Χαρακτηριστικά παραδείγματα λαθών, που φαίνονται στην εικόνα, είναι: A. Τα αυτοκίνητα στις θέσεις [Α] και [D] της εικόνας δε θα μπορούσαν να εντοπιστούν, λόγω της χαμηλής αντίθεσης των αυτοκινήτων με το περιβάλλον τους. B. Στο σημείο [Β] οι σκιές των δέντρων έχουν αναγνωριστεί ως αυτοκίνητα σκούρου χρώματος. C. Στο σημείο [C] η αντανάκλαση ενός σκουρόχρωμου αυτοκινήτου έδωσε στο σύστημα τη ψευδαίσθηση ενός ανοιχτόχρωμου αυτοκινήτου πίσω απ’ το πρώτο. Αυτά τα λάθη θα μπορούσαν να μειωθούν αν είχαμε περισσότερες πληροφορίες, όπως υψηλής ανάλυσης ψηφιακά μοντέλα του εδάφους ή τη θέση του ήλιου. Με αυτό τον τρόπο θα μπορούσαμε να αποκλείσουμε και τις σκιές πίσω από μεγάλα οχήματα, όπως φορτηγά.

Ως κλείσιμο, στην Εικόνα 13 βλέπουμε το αποτέλεσμα της εκτίμησης δραστηριότητας οχημάτων (μέρος v).

Προσωπικά εργαλεία