[Rapport] Économie expérimentale appliquée à la coopération et la confiance dans des communautés en ligne : une série d’expériences novatrices menée au CREM (Rennes 1)

, par David Masclet, Laurent Denant-Boemont, Thierry Pénard

Dans le cadre de ce projet de recherche, des chercheurs du CREM (Rennes 1) ont mené une série expériences sur la plate-forme expérimentale du LABEX, qui visaient à analyser le rôle de l’information, de la réputation, de la confiance et des incitations dans un contexte de relations répétées en réseau (communautés en ligne, Intranet et Extranet).

Ces expériences cherchaient à identifier et caractériser les facteurs techniques, comportementaux, psychologiques et institutionnels qui peuvent encourager ou déstabiliser la coordination collective en réseau.

Le succès des sites d’enchères et places de marché tels eBay ou AmazonMarketPlace, où des millions d’internautes procèdent à des transactions marchandes, constituent un défi aux règles économiques. En effet, l’anonymat permis par Internet et la facilité d’entrer ou de sortir de ces places de marchés ne sont pas des facteurs a priori favorables au développement des échanges marchands. La possibilité de changer facilement d’identité et la distance physique entre l’acheteur et le vendeur peuvent créer un climat de méfiance entre les partenaires et susciter des comportements opportunistes (non paiement du bien, retard dans l’envoi du bien ou envoi d’un produit non conforme au produit décrit). De plus, les partenaires ne peuvent pas recourir à des menaces de représailles futures pour garantir le bon déroulement de leurs transactions, dans l’incertitude qu’ils sont de pouvoir rencontrer de nouveau leurs partenaires (DangNguyen et Pénard, 2004).

Comment expliquer néanmoins le succès de places de marchés comme eBay ? La même question peut se poser à propos de communautés virtuelles dans lesquelles des internautes anonymes se rendent des services mutuels, acceptent de fournir des informations gratuitement ou de contribuer au développement de logiciels libres. Comment se crée la confiance et comment les risques d’opportunisme sont-ils surmontés dans une communauté virtuelle ?

On distingue généralement trois grandes classes de communauté : les communautés épistémiques de type logiciels libres, les communautés de pratiques de type forum d’utilisateurs et les communautés de partage de type peer-to-peer. De fait, ces différentes communautés en ligne ne disposent pas toutes des mêmes facilités ou capacités pour stimuler la coopération et réduire les comportements de passager clandestin (comportement consistant à consommer sans contribuer).

Dans les communautés épistémiques qui produisent ou créent de la connaissance (logiciels libres), l’accès nécessite des compétences (coût d’entrée et de sortie élevé), ce qui réduit les risques d’opportunisme et permet d’exercer une pression sur les pairs. De plus, dans ce type de communautés, il est souvent préférable que tout le monde ne contribue pas, mais seulement les plus compétents.

Dans les communautés de pratiques qui échangent des conseils, des avis, de l’expertise (forums d’utilisateurs), l’accès est plus facile (et l’exclusion plus difficile). Dans ce type de communautés, il peut être intéressant qu’un grand nombre contribue pour disposer d’avis moyens. Mais, les contributions n’ont pas toutes la même valeur et il est très important que les membres ayant une plus grande expertise ou un goût plus avancé contribuent plus intensément que les autres (aspects quantitatifs et qualitatifs).

Dans les communautés de partage (sharing) qui échangent/partagent des ressources (fichiers, contenus) et qui sont souvent de grande taille, le coût d’entrée et de sortie est assez faible. Là, il est important que le plus grand nombre contribue pour réduire les risques de congestion sur l’accès aux ressources.

On le voit, ces différents types de communauté ne sont pas confrontés aux mêmes risques de passager clandestin ou d’opportunisme. Les besoins en contribution sont différents (certaines communautés ont besoin d’un petit nombre de contributions de grande qualité, alors que d’autres ont besoin d’un grand nombre de contributions, même modestes). Par ailleurs, ces communautés de disposent pas des mêmes instruments ou des mêmes facilités pour générer de la coopération et surmonter les problèmes d’opportunisme (différences dans les coûts d’entrée et de sortie, dans la capacité de filtrer l’entrée et d’exclure ou non, dans la taille de la communauté).

Nous avons procédé à une première série d’expériences plutôt centrées sur la coopération dans une communauté de nature épistémique. Une seconde série d’expériences s’est intéressée à la confiance et à la réputation dans une communauté de partage de type eBay. Nous allons pour chacune de ces études expérimentales, présenter le contexte, le protocole de l’expérience et les résultats obtenus.

Coopération et incitation dans une communauté épistémique.

Objectifs de l’étude.

L’objectif de cette étude menée par Laurent Denant-Boemont et Thierry Pénard, chercheurs au CREM (Rennes 1) était de mieux comprendre le fonctionnement d’une communauté en réseau dont la finalité est de produire de la connaissance ou des services : communautés de logiciels libres, réseaux d’entreprise de type intranet et extranet. Les membres de cette communauté sont donc sollicités pour fournir des services (expertise, développement de logiciels, recommandation ou évaluation). Quels sont les mécanismes incitatifs qui vont émerger dans ce type d’environnement ? L’intérêt de cette étude est de pouvoir observer en laboratoire la genèse et le fonctionnement d’une communauté expérimentale, dans des environnements différents.

Design de l’étude.

Les expériences s’appuie sur un modèle théorique d’interactions stratégiques développé par Dang N’Guyen et Pénard (2005, 2001). Dans cette communauté, des individus peuvent émettre des requêtes qu’ils adressent aux autres membres de la communauté, en les accompagnant de différents types d’incitations. Le traitement de cette requête permet de produire un service. Les membres sollicités peuvent choisir de traiter la requête ou de décliner l’offre, en espérant que celle-ci sera traitée par un autre membre. Toutefois, le fait d’attendre peut être coûteux collectivement dans la mesure où la valeur du service se déprécie avec le temps (coût du retard). Si la personne qui envoie des requêtes veut maximiser son gain ou son utilité, quelles incitations doit-elle envoyer au reste de la communauté ? L’article explore deux types d’incitations : une rémunération monétaire pour celui qui accepte de traiter la requête et un accès plus ou moins ouvert (libre) au service dérivé du traitement de la requête. Dans ce dernier cas, l’émetteur s’engage auprès de la communauté à diffuser l’intégralité ou seulement une partie du résultat du traitement de la requête : par exemple, il peut permettre un libre accès ou un accès partiel à certaines fonctionnalités d’un logiciel ou au code source.

Les prédictions théoriques de ce modèle de communauté sont assez simples : la stratégie dominante de l’émetteur est de proposer une rémunération monétaire nulle et un degré d’ouverture total sur le résultat du traitement de la requête. Par ailleurs, la stratégie optimale de l’émetteur ne dépend nullement de la valeur de la requête ou du coût du retard suite à un refus de traiter la requête. Ce modèle théorique a donné lieu à une série d’expériences afin de voir si les choix des sujets étaient bien conformes aux stratégies prédites.

Le design expérimental se base sur des communautés de taille réduite (5 sujets) dont les membres reçoivent de manière aléatoire des rôles (ils sont émetteurs ou récepteurs de requêtes). Par ailleurs, les récepteurs sont hétérogènes quant au coût du traitement de la requête. De plus, le processus est itératif : l’émetteur fait sa proposition, laquelle est proposée de manière aléatoire à un premier joueur. Si celui-ci refuse, un autre joueur se voit proposer la requête, toujours au hasard, mais le produit du traitement de la requête voit sa valeur diminuer ; etc. La période de jeu s’arrête quand l’un des membres du groupe accepte de traiter la requête (voir en annexe pour les instructions détaillées de l’expérience).

Ce jeu est mis en œuvre dans le cadre de quatre traitements expérimentaux, qui diffèrent les uns des autres par le niveau de la valeur du traitement de la requête et du coût du retard. Les joueurs répètent ce jeu à quinze reprises, chaque période étant l’occasion d’une redistribution aléatoire des rôles au sein des groupes constitués au début du jeu.

Résultats obtenus.

Les figures 1 et 2 indiquent les choix des sujets en matière d’incitations pour le traitement des requêtes. Rappelons que chaque émetteur de requête devait initialement indiquer la rémunération qu’il accordait à celui qui traitait sa requête (il avait le choix entre un montant nul ou égal à 1, 2, 3 ou 4). Il devait aussi choisir un degré d’ouverture ou d’accès au résultat du traitement de la requête : 0%, 25%, 50%, 75% ou 100%. Un niveau d’ouverture égal à 100% implique une ouverture totale (tous les membres du groupe profitent intégralement du gain issu du traitement de la requête) et un niveau égal à 0% implique une fermeture totale (seul l’émetteur profite du gain de la requête si celle-ci est traitée).

_On constate que les stratégies prédites en matière d’incitations sont rarement suivies. La rémunération monétaire est nulle dans seulement un cas sur dix. Dans 69 % des cas, les émetteurs choisissent un montant de rémunération modérée, mais positif (égal à 1 ou 2) et dans seulement 4% des cas, ils proposent la rémunération maximale.

Distribution des rémunerations monétaires choisies par les émetteurs de requête.

Concernant le degré d’accès au résultat du traitement de la requête (graphique 2), les choix sont plus conformes aux attentes. Près de la moitié des émetteurs choisissent l’ouverture totale et 83% une ouverture supérieure ou égale à 50%.

Distribution du degré d’accès choisi par les émetteurs de requête.

Par ailleurs, le choix des instruments (notamment les incitations monétaires) dépend de la valeur du traitement de la requête, mais aussi du coût du retard, ce qui va à l’encontre des prédictions théoriques issues du modèle d’interactions.

Lorsque l’on s’intéresse aux décisions des individus sollicités pour traiter les requêtes, on constate que le nombre de refus est relativement faible, avec un refus en moyenne par requête. Le niveau de coopération est donc élevé dans cette communauté expérimentale, sans doute en raison des fortes incitations accompagnant les requêtes, mais également parce que les individus sont à la fois émetteur et récepteur de requête, encourageant la réciprocité et le sentiment d’appartenance à la communauté. Par ailleurs, le nombre de refus diminue avec le coût du retard, mais n’est pas affecté par la valeur de la requête.

Au final, cette étude expérimentale apporte des éclairages intéressants sur le fonctionnement des communautés Internet et sur l’émergence de mécanismes incitatifs au sein de ces communautés décentralisées.

Confiance et réputation dans une communauté de partage (d’information).

La seconde étude menée par David Masclet et Thierry Pénard, chercheurs au CREM (Rennes 1) s’intéresse au fonctionnement des communautés de partage d’information, à travers le cas d’eBay.

Contexte et état de l’art.

Les utilisateurs d’eBay forment de fait une communauté en ligne, auprès de laquelle eBay met à disposition une plateforme d’échanges marchands, qui comprend notamment un système d’évaluation fonctionnant sur le principe d’un partage d’informations. Ces informations portent sur le déroulement des transactions effectuées sur la plate-forme et sur la fiabilité des utilisateurs d’eBay. Précisément, ce système donne la possibilité à l’acheteur et au vendeur à la fin de chaque transaction d’adresser une évaluation positive, neutre ou négative à son partenaire, en ajoutant éventuellement des commentaires. Chaque participant eBay se caractérise donc par son profil d’évaluation, à partir duquel est calculé un score selon la formule suivante [1] : chaque évaluation positive est comptabilisée +1, chaque évaluation neutre 0 et chaque évaluation négative -1. Lorsqu’un participant envisage d’effectuer une transaction avec une autre personne, il a donc une idée de la fiabilité de son partenaire. Il peut aussi consulter les avis des partenaires précédents. Il dispose enfin d’informations sur la réputation des évaluateurs et peut donc savoir quel crédit accorder à chacune des évaluations. Par exemple, il n’accordera pas forcément la même valeur à une évaluation négative si elle est émise par une personne ayant un mauvais score ou par une personne ayant une excellente réputation.

Un certain nombre d’études ont cherché à évaluer empiriquement l’impact des évaluations et commentaires postés par les acheteurs et vendeurs à l’occasion d’une transaction en ligne (Lucking et Reiley 1999, Kalyanam et McIntyre, 2001, Melnik et Am, 2002, Cabral et Hortacsu, 2005). Pour une synthèse des différentes études sur ce sujet, se reporter à Resnick, Zeckhauser, Swanson et Lockwood (2003). Par exemple, Ghose, Ipeirotis et Sundararajan (2006) ont trouvé que la marge réalisée par les revendeurs de logiciel sur AmazonMarketplace était croissante avec leur expérience (le nombre de transactions réalisées), leur score et les commentaires positifs qu’ils avaient reçus. De leur côté, Houser et Wooders (2001) ont étudié des enchères sur des processeurs Pentium III 500 durant l’automne 1999 sur eBay. Ils trouvent qu’une hausse de 10% du nombre d’évaluations positives adressées à un vendeur augmente le prix obtenu par ce dernier de 0.17 %, alors qu’une hausse de 10% du nombre d’évaluations neutres ou négatives diminue le prix obtenu de 0.24 %. En revanche, le nombre d’évaluations positives, négatives ou neutres sur l’acheteur n’a aucun impact sur le prix acquitté. Ainsi, seule la réputation du vendeur semble importante dans les transactions. Ceci s’explique par le fait que les risques d’opportunisme sur eBay proviennent essentiellement du vendeur, l’acheteur devant effectuer le paiement avant de recevoir l’objet. Une autre étude expérimentale menée par Resnick, Zeckhauser, Swanson et Lockwood (2003) va dans le même sens qu’Houser et Wooders. Des lots similaires de cartes postales anciennes ont été mis en vente sous l’identité d’un vendeur expérimenté ayant une bonne réputation, puis sous l’identité de vendeurs inexpérimentés. _ La différence dans les dispositions à payer des acheteurs est de près de 8%. En revanche, la différence de prix n’est pas significative entre un vendeur inexpérimenté avec et sans évaluation négative. Resnick et Zeckhauser (2002) pour leur part parviennent à un résultat plus nuancé. Ils ne trouvent aucun effet des évaluations sur le prix de vente de lecteurs MP3. Toutefois, ils montrent que ces évaluations jouent sur la probabilité que la transaction se fasse. Ainsi, un vendeur sans évaluation aura une probabilité de 72% de vendre son bien, alors qu’un profil d’évaluation égal à 70 se retrouve avec une probabilité de 96%.

Avec un système d’évaluation à la eBay, chacun est donc incité à être le plus honnête possible pour recevoir des évaluations positives et acquérir une bonne réputation, qui permettra de mieux acheter et mieux vendre dans les transactions futures. De plus, une fois que l’on dispose d’une bonne réputation, il devient coûteux de changer d’identité (consistant à revenir sur eBay sous un nouveau pseudonyme), ce qui réduit d’autant plus les incitations à être opportuniste. Néanmoins, l’efficacité de ce système d’évaluation repose sur une participation élevée des acheteurs et vendeurs à ce système. Or, certains peuvent être tentés de laisser aux autres le soin de fournir des évaluations, considérant que cela nécessite du temps et un effort d’évaluer. Ces comportements de passagers clandestins, s’ils se généralisent, peuvent être préjudiciables pour une place de marché comme eBay. Il s’agit là du problème classique de contribution à un bien public ou plus exactement à un bien communautaire qui est mis à la disposition de tous les utilisateurs de la place de marché, sans exclusion, ni rivalité.

Plusieurs études ont mis en évidence ce phénomène de sous-contribution au système d’évaluation eBay. Ainsi, Resnick and Zeckhauser (2002) ont analysé en détail toutes les transactions ayant eu lieu sur eBay entre février et juin 1999, ainsi que l’historique des évaluations en relation avec ces transactions. D’après leurs données, 50% des transactions ont été évaluées par les acheteurs et 60% par les vendeurs. Concernant les évaluations des acheteurs, seulement 0.6% étaient négatives et 0.3% neutres et du côté des vendeurs, 1.6% étaient négatives et 0.3% neutres. _ Lorsque l’on regarde les destinataires de ces mauvaises évaluations, les vendeurs ont une probabilité d’autant plus élevée de recevoir une mauvaise évaluation qu’ils sont peu expérimentés (même chose pour les acheteurs). Par ailleurs Resnick et Zeckhauser mettent en évidence le pouvoir prédictif des évaluations passées sur la qualité des transactions courantes. Une transaction aura une probabilité plus élevée de présenter un problème (une évaluation positive ou négative) si dans le passé le vendeur a fait l’objet d’une évaluation négative. Enfin, les auteurs observent des phénomènes de réciprocité autour des évaluations. Ainsi, lorsque l’évaluation de l’acheteur est positive, la probabilité est plus grande que le vendeur réponde à son tour et évalue positivement la transaction. Inversement pour une évaluation négative, la probabilité de répondre par une évaluation négative ou neutre est plus grande. Les acheteurs et vendeurs sont sans doute incités à envoyer des évaluations positives, dans l’espoir que l’autre partie renvoie à son tour une évaluation positive permettant d’améliorer son profil. De même, certains participants pourraient préférer renoncer à mettre une évaluation négative "justifiée" de peur d’avoir en retour une évaluation négative "injustifiée". Cette peur des représailles pourrait avoir des effets pervers. Certains participants ayant une haute réputation pourraient se comporter de manière opportuniste avec des participants de faible réputation, sans risquer d’évaluations négatives (en jouant sur les menaces de représailles).

Dellarocas, Fan et Wood (2004) ont, pour leur part, observé 51 000 enchères sur des pièces de monnaie de collection entre avril et septembre 2002 sur eBay. Ils constatent que 77 % des vendeurs et 67% des acheteurs ont laissé une évaluation, dans la plupart des cas, positive. A partir de ces données, les auteurs ont cherché à identifier les motivations des utilisateurs d’eBay à contribuer à ce système communautaire de réputation. Ils recensent trois principales motivations :

 l’altruisme pur : j’évalue mes partenaires parce que je sais que c’est bon pour l’ensemble de la communauté,

 l’altruisme impur ou la réciprocité : j’évalue mes partenaires parce qu’ils m’ont évalué et que je réponds à leur bienveillance,

 l’égoïsme : je n’évalue pas mes partenaires sauf si je veux me faire passer pour un altruiste et les inciter à m’évaluer.

Dans le dernier cas, il s’agit d’une évaluation de nature stratégique où l’individu décide d’évaluer dès la fin de la transaction, s’il pense qu’il a de fortes chances d’avoir face à lui un partenaire réciprocateur (ce dernier répondant alors à une évaluation positive par une évaluation positive). De cette manière, l’utilisateur égoïste peut accroître son score et donc sa réputation. Dellarocas et al. (2004) pour isoler les motivations d’évaluation dans chacune des transactions de pièces de monnaie de collection, ont regardé plusieurs jours après la fin de l’enchère, si l’acheteur et le vendeur avait procédé à des évaluations. À partir de ces informations, ils calculent des probabilités d’évaluer son partenaire et des probabilités conditionnelles au fait d’avoir été ou non évalué par ce dernier. En cas d’altruisme pur, le fait d’avoir été évalué ou non devrait être sans effet sur la probabilité d’évaluer alors qu’en cas d’altruisme impur, le fait d’avoir été évalué devrait accroître la probabilité d’évaluer (effet positif). Enfin, en cas d’égoïsme, le fait d’avoir déjà été évalué devrait conduire l’internaute à ne plus évaluer son partenaire (effet négatif), et le fait de ne pas avoir été évalué pourrait l’inciter à évaluer son partenaire s’il pense avec une probabilité non nulle qu’il a affaire à un réciprocateur. Les auteurs trouvent en fait que la communauté eBay est composée à la fois d’altruistes, de réciprocateurs et d’égoïstes. Les contributions au mécanisme de réputation d’eBay relèveraient donc de différentes motivations qui vont de l’altruisme pur à l’égoïsme.

Objectifs de l’étude.

L’objectif de nos expériences est précisément d’identifier les motivations de contribuer à un système d’évaluation à la eBay et de comprendre comment un tel système peut créer de la confiance. Pour cela, nous recourons à une approche expérimentale, basée sur le jeu de la confiance ou trust game. Ce jeu est une bonne approximation de ce que peut être une transaction à la eBay. En effet, sur eBay, un des partenaires commerciaux (l’acheteur) doit envoyer un paiement à l’autre partenaire (le vendeur), en espérant être livré en retour. L’acheteur est donc amené à faire confiance au vendeur. On voit l’analogie avec le jeu de la confiance, dans lequel deux joueurs reçoivent une dotation, l’un des joueurs devant choisir dans sa dotation le montant qu’il souhaite envoyer à l’autre joueur. Ce dernier reçoit alors un multiple du montant envoyé (trois fois le montant en règle générale) et doit décider combien il renvoie au premier joueur. L’équilibre de Nash de ce jeu est trivial : le deuxième joueur ayant toujours intérêt à tout garder pour lui, le premier joueur doit donc ne rien envoyer et chacun obtient au final un gain égal à sa dotation initiale. Mais, cette situation est globalement sous-optimale, puisqu’en envoyant toute sa dotation, le premier joueur aurait pu accroître le total des gains des deux joueurs. Berg, Dickaut and Mc Cabe (1995) ont observé expérimentalement que les choix des joueurs étaient loin d’être conformes à l’équilibre de Nash : les sujets envoient en moyenne 50% de leur dotation et obtiennent en retour 1/3 en moyenne du montant reçu par leur partenaire.

Par rapport au jeu de confiance classique, nous avons ajouté une seconde étape après les décisions d’investissement et de retour des joueurs, dans laquelle ces derniers ont la possibilité de poster une évaluation positive ou négative sur leur partenaire. Trois dispositifs d’évaluation ont été expérimentés : une évaluation simultanée, une évaluation séquentielle (où l’un des joueurs est désigné pour évaluer en premier) et une évaluation au choix sur deux périodes (chacun des joueurs ayant la possibilité d’évaluer immédiatement ou d’attendre). L’intérêt de ces trois traitements, auxquels s’ajoute un traitement de base (un jeu sans évaluation) est de mieux comprendre les motivations de contribuer à un dispositif communautaire d’évaluation, en distinguant les motifs altruistes, égoïstes et de réciprocité. Quel est le dispositif d’évaluation qui génère le plus de confiance et donc d’investissements ? Les sujets ont-il plus tendance à évaluer s’ils doivent le faire simultanément ou séquentiellement ? Préfèrent-ils attendre ou évaluer le plus rapidement possible pour inciter les autres à le faire ? Les expériences menées au LABEX (Université de Rennes 1) permettent de répondre à ces questions.

Il existe peu d’études expérimentales sur ces questions, à l’exception de Keser (2002, 2003). Cette dernière a mené une série d’expériences présentant des traits communs avec la notre. Elle considère un jeu de confiance séquentiel, suivi d’une deuxième phase dans laquelle seul le premier joueur, noté A, (celui qui doit envoyer une partie de sa dotation) a la possibilité sans aucun coût, d’évaluer positivement ou négativement son partenaire, noté B, après avoir pris connaissance de la somme retournée par ce dernier.

L’expérience se déroule sur vingt périodes, les joueurs A rencontrant à chaque période un joueur B différent. Keser propose deux variantes pour le système d’évaluation. Dans un premier cas, le joueur A est informé de l’évaluation qu’a reçu à la période précédente le joueur B avec lequel il va entrer en relation (connaissance partielle du passé). Dans le deuxième cas, il est informé de l’ensemble des évaluations que B a reçu dans le passé (connaissance de toute l’histoire). Keser observe plus d’investissements et donc plus de confiance des joueurs A avec un système de réputation que sans système de réputation et un plus grand retour des joueurs B avec un système de réputation que sans système de réputation (en absolu et en % du montant reçu). Mais, il n’existe pas de différence significative d’investissements et de retour avec un système de réputation de court terme (mémoire partielle) et de long terme (mémoire complète).

Design de l’expérience.

Les expériences ont été menées en novembre 2005 et janvier 2006, auprès de plus 240 étudiants, au LABEX (Laboratoire d’expérimentation en sciences sociales de l’Université de Rennes 1). Voir en annexe pour les instructions détaillées des expériences. Nous avons procédé tout d’abord à un jeu de confiance simultané (trust game) sans période d’évaluation (traitement SANS). Ont été créées des communautés de 10 sujets, comportant 5 joueurs A (les investisseurs) et des joueurs B (ceux qui reçoivent l’investissement). Le jeu comprenait 20 parties et chaque sujet gardait le même rôle durant l’expérience. Au début de chaque partie, chacun des joueurs A est apparié avec un joueur B (l’appariement étant différent d’une partie à l’autre). Les deux joueurs reçoivent une dotation initiale de 10. De manière simultanée, le joueur A doit décider d’envoyer un montant compris entre 0 et 10 à B et le joueur B doit choisir un montant à renvoyer compris entre 0 et le montant reçu (le montant envoyé par A multiplié par 3), et ce pour tous les montants que peut lui envoyer le joueur A. Pour chaque partie, le gain du joueur A est égal à 10-montant envoyé+montant retourné et le gain du joueur B à 10 + 3*montant reçu - montant renvoyé. A la fin de l’expérience, les gains étaient cumulés et convertis sur la base de 1 euro pour 30 points, auxquels s’ajoutait un forfait de participation de 3 euros.

Les trois autres traitements (SIM, SEQ-ENDO, SEQ-EXO) sont identiques au jeu précédent, pour ce qui concerne le jeu de confiance, mais comportent une phase d’évaluation une fois connus les montants envoyés ou renvoyés. Celui qui décide d’évaluer a le choix entre donner un point négatif (-1) ou un point positif (+1) d’évaluation. Dans les deux cas, il doit supporter un coût égal à un, alors que celui qui est destinataire de l’évaluation ne supporte aucun coût. Par contre, le point négatif ou positif d’évaluation adressé à un joueur est enregistré dans sa grille d’évaluation qui va le suivre tout au long de l’expérience. Cette grille comporte un historique des points évaluations, ainsi qu’un score qui est la somme cumulée des points positifs ou négatifs obtenus dans les parties précédentes. Cette grille est communiquée à chaque nouvelle partie au participant avec lequel il est mis en relation. Ainsi à chaque début de partie, chaque sujet connaît la grille d’évaluation de son partenaire et peut donc se faire idée de la réputation de ce dernier.

Concernant le déroulement des évaluations dans les trois traitements, les joueurs sont sollicités en même temps dans le traitement SIM, alors que dans le traitement SEQ-EXO, un tirage aléatoire désigne l’ordre dans lequel les deux étaient sollicités pour évaluer. Durant une expérience en traitement SEQ-EXO, un sujet peut donc alterner des parties dans lequel il est sollicité en premier et des parties dans lequel il est sollicité en deuxième. Enfin, dans le traitement SEQ-ENDO, chaque sujet a le choix entre évaluer immédiatement ou attendre, sachant qu’il ne peut évaluer qu’une seule fois au cours d’une partie. Nos expériences se distinguent de celles de Keser (2002, 2003) sur plusieurs points, puisqu’elle considère un jeu de confiance séquentiel, dans lequel seul le joueur A peut évaluer et sans aucun coût. L’inconvénient chez Keser, c’est qu’il est difficile en cas de retour faible du joueur B, de distinguer un comportement opportuniste et un comportement de représailles. Notre jeu, de ce point de vue, permet de mieux isoler ce qui relève de l’opportunisme (puisque les décisions d’envoi et de retour sont simultanées) et ce qui relève de la sanction (sous la forme d’une évaluation négative). Par ailleurs, nos quatre dispositifs d’évaluation permettent d’étudier plus finement les motifs d’évaluation et de comparer leur efficacité.

Résultats obtenus.

Le tableau 1 présente les niveaux moyens d’investissements de A et de retour de B, selon les différents traitements expérimentaux. La possibilité d’évaluer son partenaire permet bien de générer de la confiance. En effet, le niveau d’investissement de A est en moyenne plus faible en l’absence de dispositif d’évaluation (2,24). Les investissements les plus élevés ont lieu lorsque les sujets peuvent s’évaluer simultanément (4,36) ou séquentiellement selon un ordre prédéfini (4,17). Le dispositif d’évaluation en deux périodes se situe entre les deux (investissement moyen de 3,32). Il semble donc que le traitement SEQ-ENDO en permettant des stratégies d’évaluation plus sophistiquées (possibilités d’attendre pour répondre à l’évaluation du partenaire, possibilité de s’engager en premier pour susciter une évaluation de la part du partenaire) affecte négativement (externalités négatives des évaluations) le niveau de confiance des joueurs, par rapport aux deux autres dispositifs d’évaluation.

SANS
SIM|SEQ_EXO|SEQ_ENDO
Investissement du joueur A 2,2 (2,9) 4,4 (3,7) 4,2 (3,5) 3,3 (3,2)
Investissement du joueur B 1.4 (3.2) 4.2 (6.3) 4,0 (5,3) 3,0 ( 4,8)
Retour d’investissement 12% 23% 22% 19%

Tableau 1. Les niveaux moyens d’investissement et de retour selon les traitements expérimentaux (les écart types sont donnés entre parenthèse).

Les niveaux de retour de la part du joueur B sont également significativement plus élevés avec évaluation, que sans évaluation. Ainsi en moyenne, B retourne 1.45 unités dans le traitement SANS contre 4,21 dans le traitement SIM et 3.98 dans le traitement SEQ_EXO. La possibilité d’évaluer sur deux périodes (SEQ_ENDO) conduit à des retours plus faibles (3) qu’avec des dispositifs d’évaluation simultanée ou séquentielle, mais significativement supérieur au niveau moyen de retour en l’absence de dispositif d’évaluation. En terme relatif, les sujets B renvoient seulement 11,8% du montant reçu en l’absence d’évaluation (ce qui signifie que A reçoit moins que le montant investi) alors qu’avec évaluation les taux de retour sont entre 19,1% et 22,8% (toujours en dessous du seuil des 33% permettant à A de récupérer le montant investi).

Les figures 3 et 4 représentent respectivement le niveau d’investissement de A et le montant retourné par B sur l’ensemble des périodes selon le traitement en vigueur. Une caractéristique commune est la baisse du niveau moyen d’investissement de A et de retour de B au cours du temps.

Niveau moyen d’investissement de A par traitement au cours du temps.
Niveau moyen d’investissement de B par traitement au cours du temps.

Concernant le choix d’évaluer son partenaire, on observe qu’un sujet est d’autant plus incité à évaluer négativement (resp. positivement) que le niveau d’investissement ou de retour de son partenaire est bas (resp. élevé). Par ailleurs, le participant A donne majoritairement des points négatifs lorsqu’il évalue, alors que le participant B donne principalement des points d’évaluation positifs. Enfin les sujets évaluent davantage avec un dispositif d’évaluation séquentielle que simultanée. Ainsi le participant A évalue dans 22% des cas dans le traitement SIM et respectivement 24% et 27% des cas dans les traitements SEQ_EXO et SEQ_ENDO. Ces résultats semblent donc indiquer qu’une partie des évaluations dans les traitements séquentiels sont décidées en réponse à l’investissement ou retour effectué par le partenaire, mais également en réaction à l’évaluation (ou la non évaluation) faite par ce dernier. Ainsi, dans les dispositifs d’évaluation séquentielle, un individu qui a reçu un point d’évaluation négatif en première étape donne en retour un point négatif dans 72% des cas. A l’opposé, un sujet qui a reçu un point positif en première étape donne un point positif en deuxième étape dans 63% des cas. Par ailleurs, les évaluations positives sont plus importantes en première étape que les évaluations négatives, suggérant que certains joueurs cherchent à susciter des effets de réciprocité chez leur partenaire.

Au final, cette expérience permet de mieux comprendre le rôle joué par la confiance et la réputation dans une communauté Internet et ainsi offre des pistes de réflexion sur la manière d’améliorer l’efficacité de la coopération dans ces communautés.

Notes

[1Toutefois, si une même personne a donné plusieurs fois une évaluation de même signe, cette évaluation ne sera comptabilisée qu’une seule fois afin d’éviter toute manipulation du système visant à gonfler artificiellement la réputation d’une personne ou au contraire à détruire intentionnellement sa réputation.