2010-04-12

 

De l'équilibre entre l'innovation et l'imitation

Dans le numéro du 9 avril de la revue Science, un groupe composé de Luke Rendell et de plusieurs autres collaborateurs de Kevin Laland rapportait les résultats d'un tournoi bien particulier. Les concurrents étaient des logiciels informatiques incorporant des stratégies d'apprentissage dans le contexte de la théorie des jeux, de l'apprentissage social et de l'évolution culturelle. Il s'agissait de déterminer quelle était la stratégie comportementale la plus profitable. Les stratégies en lice pouvaient combiner l'utilisation des comportements acquis, l'imitation de modèles dans la communauté ou l'apprentissage individuel de nouveaux comportements, plus innovant mais procédant par tâtonnements.

Le tournoi a été remporté par Daniel Cownden et Timothy Lillicrap de l'Université Queen's à Kingston, dont la stratégie gagnante (baptisée discountmachine parce qu'elle estimait à presque rien la valeur des gains à venir comparés aux gains immédiats) avait recours presque exclusivement à l'utilisation des comportements acquis et à l'apprentissage par imitation. La journaliste Elizabeth Pennisi décrit ainsi la stratégie primée :

« That involved weighing how fast the environment will change—if it’s changing fast, then past social learning gets outdated quickly—and how good, and reliable, the payoffs for an action were. Based on that information, discountmachine decides whether to do what it already knows how to do, getting an immediate reward, or whether to see what someone else is doing and learn from them, in the hope of getting what might be a bigger reward later. »

Dans un tel cas, c'est fort tentant de généraliser et de conclure que le succès des stratégies basées sur l'imitation, loin devant celles faisant appel à l'apprentissage autonome, démontre qu'il est plus avantageux d'imiter ce qui se fait déjà ailleurs (parce que personne ne va opter pour un comportement improductif quand il a mieux dans sa manche) et de ne pas perdre trop de temps à apprendre ou à innover, en particulier si l'environnement est relativement stable. Ce qui pourrait suggérer que le conservatisme qui consiste à reproduire les idées et les normes des autres est souvent avantageux et qu'on a intérêt à ne pas trop investir dans l'apprentissage par soi-même. (Notons toutefois qu'il s'agit d'un résultat moyen et que l'innovation, de temps en temps, rapporte gros, au profit cependant d'une part de déchet importante.)

Un tel constat expliquerait pourquoi la science-fiction — ainsi que l'extrapolation futuriste en général — est condamnée à demeurer un champ d'intérêt minoritaire, qui n'attire que les individus plus enclins que les autres à parier sur l'apprentissage individuel. Sauf peut-être quand les temps et les circonstances changent si vite qu'imiter les comportements existants semble inadéquat. En même temps, les résultats de ce tournoi suggèrent qu'on a bien raison de dorloter l'innovation (au moyen de subsides au besoin) tout simplement parce que ce ne serait pas la voie empruntée en l'absence de telles aides...

Libellés : ,


Comments: Publier un commentaire

<< Home

This page is powered by Blogger. Isn't yours?