NTUA Seminar: "Προσαρμοστική βελτιστοποίηση για στοχαστικά συστήματα υπό ελλιπή πληροφόρηση: Το πρόβλημα multi-armedbandit με περιορισμούς" απο τον Αποστόλη Μπουρνέτα (ΕΚΠΑ)

Wed 4 Mar 2020 - 16:59

Σεμινάριο του Τομέα Μαθηματικών ΣΕΜΦΕ ΕΜΠ από τον Αποστόλη Μπουρνέτα (ΕΚΠΑ)

Η διάλεξη θα δοθεί την Παρασκευή 6/3 στις 13:05, στην αίθουσα Σεμιναρίων του Τομέα Μαθηματικών ΣΕΜΦΕ (κτ. Ε Γενικών Εδρών, β’ όροφος)

---------------------------------------------

Τίτλος

Προσαρμοστική βελτιστοποίηση για στοχαστικά συστήματα υπό ελλιπή πληροφόρηση: Το πρόβλημα multi-armedbandit με περιορισμούς

Περίληψη

Το μοντέλο multi-armed bandit είναι ένα γενικό πλαίσιο βελτιστοποίησης στοχαστικών συστημάτων υπό ελλιπή πληροφόρηση. Αναφέρεται σε ένα σύνολο στατιστικών πληθυσμών από τους οποίους οι διαδοχικές παρατηρήσεις ακολουθούν πλήρως ή εν μέρει άγνωστες κατανομές. Σε κάθε βήμα ένας αποφασίζων επιλέγει ένα πληθυσμό από τον οποίον παίρνει μια παρατήρηση. Οι παρατηρήσεις θεωρούνται ως κέρδος ή αμοιβή για τον αποφασίζοντα, που επομένως θέλει να μεγιστοποιήσει τη συνολική αναμενόμενη αμοιβή του κάτω από κατάλληλα ορισμένα κριτήρια. Το πρόβλημα εντοπίζεται στην εύρεση πολιτικών επιλογής πληθυσμών που συνδυάζουν αποτελεσματικά την εκμάθηση των άγνωστων κατανομών των αμοιβών και τη συγκέντρωση μεγάλων αμοιβών.

Το παραπάνω γενικό πλαίσιο μπορεί να χρησιμοποιηθεί για την εύρεση προσαρμοστικά βέλτιστων λύσεων σε μεγάλη πλειάδα στοχαστικών συστημάτων υπό ελλιπή πληροφόρηση. Στην ομιλία θα γίνει μια εισαγωγή στα κριτήρια βελτιστοποίησης μέσω ελαχιστοποίησης της απώλειας λόγω ελλιπούς πληροφόρησης (regret) και θα συζητηθεί η περίπτωση όπου η λήψη παρατηρήσεων από κάθε πληθυσμό επιφέρει ένα διαφορετικό κόστος και υπάρχει ένας περιορισμός στο συνολικό κόστος δειγματοληψίας.