[Cahier de recherche] Pourquoi évaluer son partenaire lors d’une transaction à la eBay ? une approche expérimentale.

mardi 30 mai 2006, par David Masclet, Thierry Pénard

Mots clefs : confiance, économie expérimentale, évaluation, réciprocité, e-commerce.

Résumé.

L’objet de cet article est de comprendre comment la confiance peut s’établir dans le cadre de transactions à la eBay (c’est-à-dire de transactions distantes et anonymes) et quel impact peuvent avoir les évaluations faites par les acheteurs et vendeurs à l’occasion de ces transactions. Pour cela, nous avons mené une série d’expériences basées sur un jeu d’investissement (trust game) simultané, en testant différents dispositifs d’évaluation (évaluation simultanée, évaluation séquentielle, évaluation avec une option d’attente). Nos résultats montrent que la possibilité d’évaluer accroît la confiance et l’efficacité des transactions. Toutefois, l’efficacité du dispositif d’évaluation est atténuée dès lors que ce dispositif est utilisé à des fins stratégiques ou en représailles à des évaluations passées. En effet, à l’aide de modèles de choix discrets emboîtés, nous montrons que les sujets tiennent compte dans leurs décisions d’évaluation, du montant que leur a envoyé ou retourné leur partenaire, mais également de la décision d’évaluation de ce dernier quand elle est observable.

Mots clefs : confiance, économie expérimentale, évaluation, réciprocité, e-commerce.

ABSTRACT.

Several online marketplaces, like eBay provide their users with reputation management mechanisms (evaluations, ratings,...). This article aims at investigating the impact of these reputation mechanisms on trust building and market efficiency, through a set of experiments based on the trust game introduced by Berg Dickhault and McCabe (1995). We compare different evaluation systems : simultaneous evaluation, sequential evaluation, evaluation with a waiting option. Our results indicate that the existence of a reputation system increases the level of trust and cooperation. However, our study also sheds light on the limits of such systems. Indeed, evaluation can be used as a strategic instrument (to retaliate a bad evaluation), which may attenuate its efficiency.

Keywords : trust, experimental economics, evaluation, reciprocity, e-commerce.

Codes JEL : C72, C91

Sommaire

Introduction.

Introduction.

Le succès des sites d’enchères et places de marché comme eBay ou AmazonMarketPlace, où des millions d’internautes procèdent à des transactions marchandes, constituent un défi aux règles économiques. En effet, l’anonymat permis par Internet et la facilité d’entrer ou de sortir de ces places de marchés ne sont pas des facteurs a priori favorables au développement des échanges marchands. La possibilité de changer facilement d’identité et la distance physique entre l’acheteur et le vendeur peuvent créer un climat de méfiance entre les partenaires et susciter des comportements opportunistes (non paiement du bien, retard dans l’envoi du bien ou envoi d’un produit non conforme au produit décrit) (DangNguyen et Pénard, 2004).

Comment créer de la confiance et éliminer les risques d’opportunisme sur les places de marché Internet ? Certaines places de marché, notamment dans le B2B (commerce inter-entreprises) ont institué des systèmes de filtrage à l’entrée et de surveillance avec possibilité d’exclusion des utilisateurs ne respectant pas les codes de bonne conduite. Mais, ce type de dispositifs centralisés ne peut pas fonctionner pour des places s’adressant à des millions de particuliers comme eBay ou Yahoo, ou à des coûts prohibitifs. Une solution peut alors consister à décentraliser les tâches de surveillance et de sanction, en donnant à la communauté des utilisateurs de la place de marché, les outils pour le faire. Le système d’évaluation d’eBay en est le meilleur exemple. Ce système donne la possibilité à l’acheteur et au vendeur à la fin de chaque transaction d’adresser une évaluation positive, neutre ou négative à son partenaire, en ajoutant éventuellement des commentaires. Chaque participant eBay se caractérise donc par son profil d’évaluation, à partir duquel est calculé un score selon la formule suivante [1] : chaque évaluation positive est comptabilisée +1, chaque évaluation neutre 0 et chaque évaluation négative -1. Lorsqu’un participant envisage d’effectuer une transaction, il a donc une idée de la fiabilité de son partenaire. Il peut aussi consulter les commentaires qu’il a reçus de ses partenaires précédents. Il dispose enfin d’informations sur la réputation des évaluateurs et peut donc savoir quel crédit accorder à chacune des évaluations. Par exemple, il n’accordera pas forcément la même valeur à une évaluation négative si elle est émise par une personne ayant un mauvais score ou par une personne ayant une excellente réputation.

L’objectif de cet article est d’étudier l’efficacité des dispositifs d’évaluation à la eBay et d’identifier les motivations de contribuer à des systèmes d’évaluation. Pour cela, nous recourons à une approche expérimentale, basée sur le jeu de la confiance (ou trust game). Ce jeu est une bonne approximation de ce que peut être une transaction à la eBay. En effet, sur eBay, un des partenaires commerciaux (l’acheteur) doit envoyer un paiement à l’autre partenaire (le vendeur), en espérant être livré en retour. L’acheteur est donc amené à faire confiance au vendeur. On voit l’analogie avec le jeu de la confiance, dans lequel deux joueurs reçoivent une dotation, l’un des joueurs devant choisir dans sa dotation le montant qu’il souhaite envoyer à l’autre joueur. Ce dernier reçoit alors un multiple du montant envoyé (trois fois le montant en règle générale) et doit décider combien il renvoie au premier joueur. L’équilibre de Nash de ce jeu est trivial : le deuxième joueur ayant toujours intérêt à tout garder pour lui, le premier joueur doit donc ne rien envoyer et chacun obtient au final un gain égal à sa dotation initiale. Mais, cette situation est globalement sous-optimale, puisqu’en envoyant toute sa dotation, le premier joueur aurait pu accroître le total des gains des deux joueurs. Berg, Dickaut and Mc Cabe (1995) ont observé expérimentalement que les choix des joueurs étaient loin d’être conformes à l’équilibre de Nash : les sujets envoient en moyenne 50% de leur dotation et obtiennent en retour 1/3 en moyenne du montant reçu par leur partenaire [2].

Par rapport au jeu de confiance classique, nous avons ajouté une seconde étape après les décisions d’investissement et de retour des joueurs, dans laquelle ces derniers ont la possibilité de poster une évaluation positive ou négative sur leur partenaire. Trois dispositifs d’évaluation ont été expérimentés : une évaluation simultanée, une évaluation séquentielle (où l’un des joueurs est désigné pour évaluer en premier) et une évaluation séquentielle où l’ordre des joueurs est endogénéisé dans la mesure où chaque joueur peut choisir d’évaluer immédiatement ou d’attendre. L’intérêt de ces trois traitements, auxquels s’ajoute un traitement de base (un jeu sans évaluation) est de mieux comprendre les motivations de contribuer à un dispositif communautaire d’évaluation, en distinguant les motifs non stratégiques de réciprocité et de représailles, des motifs stratégiques consistant par exemple à évaluer positivement pour recevoir une évaluation positive en retour. Quel est le dispositif d’évaluation qui génère le plus de confiance et donc d’investissements ? Les sujets ont-il plus tendance à évaluer s’ils doivent le faire simultanément ou séquentiellement ? Préfèrent-ils attendre ou évaluer le plus rapidement possible pour inciter les autres à le faire ?

Il existe encore peu d’études expérimentales sur ces questions. Bolton, Katok et Ockenfels (2004) et Chen, Hogg et Wozny (2004) ont étudié l’impact de la réputation à l’aide de jeux de marché explicites. Ainsi, dans Bolton et al., l’acheteur peut choisir d’envoyer ou non son paiement au vendeur et ce dernier peut décider d’honorer ou non le contrat. Les auteurs comparent alors la proportion de transactions effectives selon que les acheteurs et vendeurs sont dans une relation répétée (partners) ou non répétée (strangers), avec ou sans système de réputation dans le deuxième cas. Ils constatent qu’en strangers, la présence d’un système de réputation (consistant à disposer de l’historique des actions passées du partenaire) améliore l’efficacité des échanges, mais ne permet pas d’atteindre l’efficacité d’une relation répétée.

De son côté, Keser (2002, 2003) a mené une série d’expériences présentant des traits communs avec nos expériences. Elle considère un jeu de confiance séquentiel, suivi d’une deuxième phase dans laquelle seul le premier joueur, noté A, (celui qui doit envoyer une partie de sa dotation) a la possibilité, sans aucun coût, d’évaluer positivement ou négativement son partenaire, noté B, après avoir pris connaissance de la somme retournée par ce dernier. L’expérience se déroule sur vingt périodes, les joueurs A rencontrant à chaque période un joueur B différent. Keser propose deux variantes pour le système d’évaluation. Dans un premier cas, le joueur A est informé de l’évaluation qu’a reçu à la période précédente le joueur B avec lequel il va entrer en relation (connaissance partielle du passé). Dans le deuxième cas, il est informé de l’ensemble des évaluations que B a reçu dans le passé (connaissance de toute l’histoire). Keser observe plus d’investissements et donc plus de confiance des joueurs A avec un système de réputation que sans système de réputation et un plus grand retour des joueurs B avec un système de réputation que sans système de réputation (en absolu et en % du montant reçu). Mais, il n’existe pas de différence significative d’investissements et de retour avec un système de réputation de court terme (mémoire partielle) et de long terme (mémoire complète).

Nos expériences se distinguent de celles de Keser (2002, 2003) sur plusieurs points. Contrairement à l’étude de Keser, notre expérience considère un jeu de confiance simultané plutôt que séquentiel, ce qui permet de mieux isoler ce qui relève de l’opportunisme (puisque les décisions d’envoi et de retour sont simultanées) et ce qui relève de la sanction (sous la forme d’une évaluation négative). Par ailleurs, dans notre design expérimental, les deux joueurs A et B peuvent évaluer, ce qui est proche de la réalité des places de marché électroniques. Enfin, contrairement à Keser, il existe dans notre étude, un coût à évaluer son partenaire qui matérialise le temps passé à évaluer l’autre participant.

Dans la section 2, nous revenons sur plusieurs études consacrées aux évaluations sur eBay. Dans la section 3, nous présentons le design expérimental du jeu de confiance. Dans la section 4, nous présentons les résultats relatifs à l’impact des évaluations sur le niveau de confiance et dans la section 5, nous étudions les déterminants des évaluations. La section 6 conclut ce papier.