Grstats Forum
NTUA Seminar: "Προσαρμοστική βελτιστοποίηση για στοχαστικά συστήματα υπό ελλιπή πληροφόρηση: Το πρόβλημα multi-armedbandit με περιορισμούς" απο τον Αποστόλη Μπουρνέτα (ΕΚΠΑ) Forumgrstats
Grstats Forum
Θέλετε να αντιδράσετε στο μήνυμα; Φτιάξτε έναν λογαριασμό και συνδεθείτε για να συνεχίσετε.

NTUA Seminar: "Προσαρμοστική βελτιστοποίηση για στοχαστικά συστήματα υπό ελλιπή πληροφόρηση: Το πρόβλημα multi-armedbandit με περιορισμούς" απο τον Αποστόλη Μπουρνέτα (ΕΚΠΑ)

Πήγαινε κάτω

NTUA Seminar: "Προσαρμοστική βελτιστοποίηση για στοχαστικά συστήματα υπό ελλιπή πληροφόρηση: Το πρόβλημα multi-armedbandit με περιορισμούς" απο τον Αποστόλη Μπουρνέτα (ΕΚΠΑ) Empty NTUA Seminar: "Προσαρμοστική βελτιστοποίηση για στοχαστικά συστήματα υπό ελλιπή πληροφόρηση: Το πρόβλημα multi-armedbandit με περιορισμούς" απο τον Αποστόλη Μπουρνέτα (ΕΚΠΑ)

Δημοσίευση από grstats Την / Το Τετ 4 Μαρ 2020 - 16:59

Σεμινάριο του Τομέα Μαθηματικών ΣΕΜΦΕ ΕΜΠ από τον Αποστόλη Μπουρνέτα (ΕΚΠΑ)

Η διάλεξη θα δοθεί την Παρασκευή 6/3 στις 13:05, στην αίθουσα Σεμιναρίων του Τομέα Μαθηματικών ΣΕΜΦΕ (κτ. Ε Γενικών Εδρών, β’ όροφος)

---------------------------------------------

Τίτλος

Προσαρμοστική βελτιστοποίηση για στοχαστικά συστήματα υπό ελλιπή πληροφόρηση: Το πρόβλημα multi-armedbandit με περιορισμούς

Περίληψη

Το μοντέλο multi-armed bandit είναι ένα γενικό πλαίσιο βελτιστοποίησης στοχαστικών συστημάτων υπό ελλιπή πληροφόρηση. Αναφέρεται σε ένα σύνολο στατιστικών πληθυσμών από τους οποίους οι διαδοχικές παρατηρήσεις ακολουθούν πλήρως ή εν μέρει άγνωστες κατανομές. Σε κάθε βήμα ένας αποφασίζων επιλέγει ένα πληθυσμό από τον οποίον παίρνει μια παρατήρηση. Οι παρατηρήσεις θεωρούνται ως κέρδος ή αμοιβή για τον αποφασίζοντα, που επομένως θέλει να μεγιστοποιήσει τη συνολική αναμενόμενη αμοιβή του κάτω από κατάλληλα ορισμένα κριτήρια. Το πρόβλημα εντοπίζεται στην εύρεση πολιτικών επιλογής πληθυσμών που συνδυάζουν αποτελεσματικά την εκμάθηση των άγνωστων κατανομών των αμοιβών και τη συγκέντρωση μεγάλων αμοιβών.

Το παραπάνω γενικό πλαίσιο μπορεί να χρησιμοποιηθεί για την εύρεση προσαρμοστικά βέλτιστων λύσεων σε μεγάλη πλειάδα στοχαστικών συστημάτων υπό ελλιπή πληροφόρηση. Στην ομιλία θα γίνει μια εισαγωγή στα κριτήρια βελτιστοποίησης μέσω ελαχιστοποίησης της απώλειας λόγω ελλιπούς πληροφόρησης (regret) και θα συζητηθεί η περίπτωση όπου η λήψη παρατηρήσεων από κάθε πληθυσμό επιφέρει ένα διαφορετικό κόστος και υπάρχει ένας περιορισμός στο συνολικό κόστος δειγματοληψίας.








grstats
grstats

Posts : 819
Join date : 21/10/2009

http://stat-athens.aueb.gr/~grstats/

Επιστροφή στην κορυφή Πήγαινε κάτω

Επιστροφή στην κορυφή


 
Δικαιώματα σας στην κατηγορία αυτή
Δεν μπορείτε να απαντήσετε στα Θέματα αυτής της Δ.Συζήτησης