NTUA Seminar: "Προσαρμοστική βελτιστοποίηση για στοχαστικά συστήματα υπό ελλιπή πληροφόρηση: Το πρόβλημα multi-armedbandit με περιορισμούς" απο τον Αποστόλη Μπουρνέτα (ΕΚΠΑ)
Wed 4 Mar 2020 - 16:59
Σεμινάριο του Τομέα Μαθηματικών ΣΕΜΦΕ ΕΜΠ από τον Αποστόλη Μπουρνέτα (ΕΚΠΑ)
Η διάλεξη θα δοθεί την Παρασκευή 6/3 στις 13:05, στην αίθουσα Σεμιναρίων του Τομέα Μαθηματικών ΣΕΜΦΕ (κτ. Ε Γενικών Εδρών, β’ όροφος)
---------------------------------------------
Τίτλος
Προσαρμοστική βελτιστοποίηση για στοχαστικά συστήματα υπό ελλιπή πληροφόρηση: Το πρόβλημα multi-armedbandit με περιορισμούς
Περίληψη
Το μοντέλο multi-armed bandit είναι ένα γενικό πλαίσιο βελτιστοποίησης στοχαστικών συστημάτων υπό ελλιπή πληροφόρηση. Αναφέρεται σε ένα σύνολο στατιστικών πληθυσμών από τους οποίους οι διαδοχικές παρατηρήσεις ακολουθούν πλήρως ή εν μέρει άγνωστες κατανομές. Σε κάθε βήμα ένας αποφασίζων επιλέγει ένα πληθυσμό από τον οποίον παίρνει μια παρατήρηση. Οι παρατηρήσεις θεωρούνται ως κέρδος ή αμοιβή για τον αποφασίζοντα, που επομένως θέλει να μεγιστοποιήσει τη συνολική αναμενόμενη αμοιβή του κάτω από κατάλληλα ορισμένα κριτήρια. Το πρόβλημα εντοπίζεται στην εύρεση πολιτικών επιλογής πληθυσμών που συνδυάζουν αποτελεσματικά την εκμάθηση των άγνωστων κατανομών των αμοιβών και τη συγκέντρωση μεγάλων αμοιβών.
Το παραπάνω γενικό πλαίσιο μπορεί να χρησιμοποιηθεί για την εύρεση προσαρμοστικά βέλτιστων λύσεων σε μεγάλη πλειάδα στοχαστικών συστημάτων υπό ελλιπή πληροφόρηση. Στην ομιλία θα γίνει μια εισαγωγή στα κριτήρια βελτιστοποίησης μέσω ελαχιστοποίησης της απώλειας λόγω ελλιπούς πληροφόρησης (regret) και θα συζητηθεί η περίπτωση όπου η λήψη παρατηρήσεων από κάθε πληθυσμό επιφέρει ένα διαφορετικό κόστος και υπάρχει ένας περιορισμός στο συνολικό κόστος δειγματοληψίας.
Η διάλεξη θα δοθεί την Παρασκευή 6/3 στις 13:05, στην αίθουσα Σεμιναρίων του Τομέα Μαθηματικών ΣΕΜΦΕ (κτ. Ε Γενικών Εδρών, β’ όροφος)
---------------------------------------------
Τίτλος
Προσαρμοστική βελτιστοποίηση για στοχαστικά συστήματα υπό ελλιπή πληροφόρηση: Το πρόβλημα multi-armedbandit με περιορισμούς
Περίληψη
Το μοντέλο multi-armed bandit είναι ένα γενικό πλαίσιο βελτιστοποίησης στοχαστικών συστημάτων υπό ελλιπή πληροφόρηση. Αναφέρεται σε ένα σύνολο στατιστικών πληθυσμών από τους οποίους οι διαδοχικές παρατηρήσεις ακολουθούν πλήρως ή εν μέρει άγνωστες κατανομές. Σε κάθε βήμα ένας αποφασίζων επιλέγει ένα πληθυσμό από τον οποίον παίρνει μια παρατήρηση. Οι παρατηρήσεις θεωρούνται ως κέρδος ή αμοιβή για τον αποφασίζοντα, που επομένως θέλει να μεγιστοποιήσει τη συνολική αναμενόμενη αμοιβή του κάτω από κατάλληλα ορισμένα κριτήρια. Το πρόβλημα εντοπίζεται στην εύρεση πολιτικών επιλογής πληθυσμών που συνδυάζουν αποτελεσματικά την εκμάθηση των άγνωστων κατανομών των αμοιβών και τη συγκέντρωση μεγάλων αμοιβών.
Το παραπάνω γενικό πλαίσιο μπορεί να χρησιμοποιηθεί για την εύρεση προσαρμοστικά βέλτιστων λύσεων σε μεγάλη πλειάδα στοχαστικών συστημάτων υπό ελλιπή πληροφόρηση. Στην ομιλία θα γίνει μια εισαγωγή στα κριτήρια βελτιστοποίησης μέσω ελαχιστοποίησης της απώλειας λόγω ελλιπούς πληροφόρησης (regret) και θα συζητηθεί η περίπτωση όπου η λήψη παρατηρήσεων από κάθε πληθυσμό επιφέρει ένα διαφορετικό κόστος και υπάρχει ένας περιορισμός στο συνολικό κόστος δειγματοληψίας.
- UNIVERSITY OF PIRAEUS - SEMINAR 17/6/2015: Single and Multi Index Models for Mean and Quantile Regression
- NTUA Seminar: Ομάδες με ομολογική διάσταση 1 από τον Γιάννη Εμμανουήλ (ΕΚΠΑ)
- NTUA Seminar: "Towards a Syntactic/Probabilistic Framework for Vision/Speech Recognition and Biological Processes" by Vasilis Gidas
- NTUA STATISTICS SEMINAR: Markov chain Monte Carlo sampling for machine learning and inverse problems by Omiros Papaspiliopoulos
- NTUA STATISTICS SEMINAR: Markov chain Monte Carlo sampling for machine learning and inverse problems by Omiros Papaspiliopoulos
Permissions in this forum:
You cannot reply to topics in this forum