Proximal Policy Optimization الإنجليزية (Q240468)

من Marefa data
model-free reinforcement learning algorithm الإنجليزية
اللغة التسمية الوصف أسماء أخرى
العربية
لم تُضف التسمية
لا يوجد وصف
    الإنجليزية
    Proximal Policy Optimization
    model-free reinforcement learning algorithm
    • PPO

    بيانات

    Wikidata item الإنجليزية
    ٠ مرجع
    subclass of الإنجليزية
    policy-gradient method الإنجليزية
    ١ مراجع
    Imported from Wikidata item الإنجليزية
    model-free reinforcement learning الإنجليزية
    ١ مراجع
    Imported from Wikidata item الإنجليزية
    discoverer or inventor الإنجليزية
    ١ مراجع
    Imported from Wikidata item الإنجليزية