Ligne 38 : | Ligne 38 : | ||
{{Tuto Step | {{Tuto Step | ||
|Step_Title=Apprentissage Par Renforcement | |Step_Title=Apprentissage Par Renforcement | ||
+ | |Step_Content=Prévoir tableau blanc (ardoise), feutre effaçable et étoiles ou gommettes | ||
+ | |||
+ | * Dessinez un labyrinthe simple sur le papier ou le tableau blanc. | ||
+ | * Indiquez le point de départ et la sortie. | ||
+ | * Placez quelques obstacles et chemins incorrects. | ||
+ | |||
+ | |||
+ | '''Règles du Jeu''' : | ||
+ | |||
+ | * Un joueur commence au point de départ et doit trouver la sortie. | ||
+ | * À chaque intersection, le joueur doit choisir une direction (gauche, droite, tout droit). | ||
+ | * Si le joueur choisit la bonne direction, il avance et reçoit une petite récompense. | ||
+ | * Si le joueur choisit la mauvaise direction, il doit revenir en arrière et essayer une autre direction. | ||
+ | |||
+ | |||
+ | '''Apprentissage Par Renforcement''' : | ||
+ | |||
+ | * Chaque fois que le joueur prend une décision correcte, il reçoit une récompense, ce qui renforce ce choix. | ||
+ | * Chaque fois que le joueur prend une mauvaise décision, il ne reçoit pas de récompense et doit réessayer. | ||
+ | * Le joueur apprend progressivement le bon chemin à suivre grâce aux récompenses et aux pénalités. | ||
+ | |||
+ | Une IA essaie différentes actions et apprend à maximiser les récompenses en évitant les pénalités. | ||
+ | |Step_Picture_00=Les_diff_rentes_formes_d_apprentissages_de_l_IA_43c4c9e1e8621316d87f6bea7a6697f1.png | ||
}} | }} | ||
{{Notes}} | {{Notes}} |
Auteur Nadialb | Dernière modification 27/11/2024 par Nadialb
Les_diff_rentes_formes_d_apprentissages_de_l_IA_images.jpeg
l'objectif est d'entrainer notre IA à reconnaitre des formes, carré ou rond ? chat ou chien ?
On utilise le site internet de vittascience : https://fr.vittascience.com/ia/images.php
Il faut des objets ou des photos d'objets de différentes formes et de couleurs variés.
Demander aux participants de regrouper les objets en fonction de leurs similarités (par exemple, par couleur, taille, forme).
Parlez des motifs que les participants ont utilisés pour regrouper les objets. Expliquez que l'apprentissage non supervisé fonctionne de manière similaire en regroupant des données similaires sans étiquettes préalables., C'est-à-dire sans avoir de point de référence comme lors de l'expérience précédente avec les carrés et les ronds.
Prévoir tableau blanc (ardoise), feutre effaçable et étoiles ou gommettes
Règles du Jeu :
Apprentissage Par Renforcement :
Une IA essaie différentes actions et apprend à maximiser les récompenses en évitant les pénalités.
Dernière modification 27/11/2024 par user:Nadialb.
Published
Vous avez entré un nom de page invalide, avec un ou plusieurs caractères suivants :
< > @ ~ : * € £ ` + = / \ | [ ] { } ; ? #