Λέσχη Φίλων Στατιστικής - GrStats forum
NTUA Seminar: "Προσαρμοστική βελτιστοποίηση για στοχαστικά συστήματα υπό ελλιπή πληροφόρηση: Το πρόβλημα multi-armedbandit με περιορισμούς" απο τον Αποστόλη Μπουρνέτα (ΕΚΠΑ) Forumgrstats

Join the forum, it's quick and easy

Λέσχη Φίλων Στατιστικής - GrStats forum
NTUA Seminar: "Προσαρμοστική βελτιστοποίηση για στοχαστικά συστήματα υπό ελλιπή πληροφόρηση: Το πρόβλημα multi-armedbandit με περιορισμούς" απο τον Αποστόλη Μπουρνέτα (ΕΚΠΑ) Forumgrstats
Λέσχη Φίλων Στατιστικής - GrStats forum
Would you like to react to this message? Create an account in a few clicks or log in to continue.
Για προβλήματα εγγραφής και άλλες πληροφορίες επικοινωνήστε με : grstats.forum@gmail.com ή grstats@stat-athens.aueb.gr

Go down
grstats
grstats
Posts : 959
Join date : 2009-10-21
http://stat-athens.aueb.gr/~grstats/

NTUA Seminar: "Προσαρμοστική βελτιστοποίηση για στοχαστικά συστήματα υπό ελλιπή πληροφόρηση: Το πρόβλημα multi-armedbandit με περιορισμούς" απο τον Αποστόλη Μπουρνέτα (ΕΚΠΑ) Empty NTUA Seminar: "Προσαρμοστική βελτιστοποίηση για στοχαστικά συστήματα υπό ελλιπή πληροφόρηση: Το πρόβλημα multi-armedbandit με περιορισμούς" απο τον Αποστόλη Μπουρνέτα (ΕΚΠΑ)

Wed 4 Mar 2020 - 16:59
Σεμινάριο του Τομέα Μαθηματικών ΣΕΜΦΕ ΕΜΠ από τον Αποστόλη Μπουρνέτα (ΕΚΠΑ)

Η διάλεξη θα δοθεί την Παρασκευή 6/3 στις 13:05, στην αίθουσα Σεμιναρίων του Τομέα Μαθηματικών ΣΕΜΦΕ (κτ. Ε Γενικών Εδρών, β’ όροφος)

---------------------------------------------

Τίτλος

Προσαρμοστική βελτιστοποίηση για στοχαστικά συστήματα υπό ελλιπή πληροφόρηση: Το πρόβλημα multi-armedbandit με περιορισμούς

Περίληψη

Το μοντέλο multi-armed bandit είναι ένα γενικό πλαίσιο βελτιστοποίησης στοχαστικών συστημάτων υπό ελλιπή πληροφόρηση. Αναφέρεται σε ένα σύνολο στατιστικών πληθυσμών από τους οποίους οι διαδοχικές παρατηρήσεις ακολουθούν πλήρως ή εν μέρει άγνωστες κατανομές. Σε κάθε βήμα ένας αποφασίζων επιλέγει ένα πληθυσμό από τον οποίον παίρνει μια παρατήρηση. Οι παρατηρήσεις θεωρούνται ως κέρδος ή αμοιβή για τον αποφασίζοντα, που επομένως θέλει να μεγιστοποιήσει τη συνολική αναμενόμενη αμοιβή του κάτω από κατάλληλα ορισμένα κριτήρια. Το πρόβλημα εντοπίζεται στην εύρεση πολιτικών επιλογής πληθυσμών που συνδυάζουν αποτελεσματικά την εκμάθηση των άγνωστων κατανομών των αμοιβών και τη συγκέντρωση μεγάλων αμοιβών.

Το παραπάνω γενικό πλαίσιο μπορεί να χρησιμοποιηθεί για την εύρεση προσαρμοστικά βέλτιστων λύσεων σε μεγάλη πλειάδα στοχαστικών συστημάτων υπό ελλιπή πληροφόρηση. Στην ομιλία θα γίνει μια εισαγωγή στα κριτήρια βελτιστοποίησης μέσω ελαχιστοποίησης της απώλειας λόγω ελλιπούς πληροφόρησης (regret) και θα συζητηθεί η περίπτωση όπου η λήψη παρατηρήσεων από κάθε πληθυσμό επιφέρει ένα διαφορετικό κόστος και υπάρχει ένας περιορισμός στο συνολικό κόστος δειγματοληψίας.








Back to top
Permissions in this forum:
You cannot reply to topics in this forum