Pour prolonger un peu les vacances, voici en édito quelques cartes issues de TripAdvisor, le site de notation bien connu des internautes. TripAdvisor est devenu un outil incontournable pour des millions de touristes, faisant et défaisant l’e-reputation des restaurants, des hôtels, et de ce que l’entreprise nomme les « attractions » — des plages du Costa Rica au Zoo de Beauval, en passant par les palais royaux d’Abomey. Forts de 125 millions d’avis et 57 millions de membres, se présentant comme le « plus grand site de voyage au monde » [1], TripAdvisor est de plus en plus analysé par les chercheurs, même si, le plus souvent, il s’agit de mentionner le classement TripAdvisor du site étudié ou de proposer des modèles marketing permettant d’analyser et d’améliorer son e-reputation. Les travaux les plus intéressants portent sur la question des jugements amateurs et la transformation de l’expertise. Mais rares sont les enquêtes qui se penchent sur les métadonnées associées aux commentaires, ou qui considèrent le site comme un objet en soi [2]. Pour s’atteler à cette tâche, il convient d’abord de distinguer deux types de données très différentes. D’une part, ce qui relève de la communication et du capital de l’entreprise, visible dans sa manière de présenter les avis des individus et les publicités de ses partenaires, mais aussi, de manière plus invisible, dans l’algorithme que le site utilise. D’autre part, les commentaires des internautes, qu’il est nécessaire d’inscrire dans leurs différents contextes — origines sociales, nationales, genre, inscription dans des logiques de mimétisme ou de distinction, etc. C’est l’enjeu d’un programme de recherche sur les traces numériques (digital footprints), en cours [3]. Ici, l’entrée se veut plus modeste et plus ludique : à partir des données disponibles sur le site, nous proposons de trip-patouiller quelques données et de les restituer sous la forme de cartes, révélant des informations alternatives à celles de l’entreprise de communication Tripadvisor.
Tripadvisor, ou les nouveaux experts.
Le site fonctionne sur un principe simple : après leur voyage, les touristes — ou du moins un petit nombre d’entre eux — postent un commentaire et une note de 1 à 5 pour chaque « endroit » ou « activité » (termes utilisés par le site francophone). Cette note permet de hiérarchiser les activités par catégories et produire, à destination des candidats au voyage, une aide à la consommation. Pour ce faire, TripAdvisor utilise un algorithme — dont la recette est jalousement gardée — qui intègre comme variables principales la quantité, la qualité et l’ancienneté (recency) des notes. Mélangeant prescription et consommation touristique, TripAdvisor participe ainsi à la révolution en cours dans l’industrie du tourisme : la fin d’un modèle basé sur la confiance donnée aux experts professionnels et aux entreprises productrices de biens et services touristiques, au profit des intermédiaires, qui, comme TripAdvisor, ont inventé un modèle économique appuyé sur la valorisation des échanges non marchands ou interpersonnels (conseils entre pairs, échanges d’appartements, couch surfing, etc.), et la vente de conseils en e-reputation auprès des prestataires traditionnels. Comme l’écrivait amèrement Edmund Burke en 1791, « the world is governed by go-betweens ». Toutefois, ce modèle se présente comme l’antithèse des anciens intermédiaires, qui produisaient eux-mêmes du savoir sur les sites, les activités, les destinations. Ainsi, selon le PDG de TripAdvisor en 2009 à propos de son partenariat avec l’UNESCO, ce savoir est désormais produit par « la sagesse collective et le soutien des millions de voyageurs de TripAdvisor ainsi que leurs points de vue avisés sur le Patrimoine mondial » (communication de l’UNESCO, 20 juillet 2009).
La plupart des commentateurs des sites croient participer à un système strictement égalitaire. Chacun pense avoir légitimité et intérêt à donner son avis sur un restaurant, un hôtel, un territoire ou un site du patrimoine mondial. Il recevra, en guise de contre-don, d’autres avis, d’autres conseils, le tout participant de « l’intelligence collective ». Cette passion de l’échange, mais aussi le succès de cette marchandisation du « don contre don » pose des questions passionnantes à l’anthropologue. Le sociologue retrouve, dans les discours tenus par les sites comme par les internautes, la question des pratiques et des légitimités des amateurs (Flichy 2010), mais aussi les trois étapes de l’action culturelle identifiées par Jean-Claude Passeron (1991) : le légitimisme qui cherche à convaincre le peuple d’entériner le choix des experts ; le populisme qui dote les cultures populaires, ici la vox populi de TripAdvisor, d’une légitimité propre à dire ce qui est bon ; et enfin, le révolutionnarisme qui, selon Passeron à propos des politiques culturelles, vise à faire disparaître la frontière entre le point de vue du peuple et celui des élites. Le sociologue se dit aussi que cette démocratie touristique pose au moins autant de problèmes que la démocratisation des vacances qui lui a précédé : outre la question récurrente des faux avis [4], les biais sont innombrables, tandis que l’égale participation et la légitimité des points de vue demeurent une vue de l’esprit.
En effet, si l’on met de coté le problème principal — la question de la surveillance ou de la « souveillance d’Internet », et la possible fin d’une utopie libertaire (Beaude 2014) —, la « démocratie digitale » (Hindman 2009) croisant consumérisme et intelligence collective, les phénomènes de démocratisation par « inclusion » (de l’ensemble de l’offre) ou par participation (des consommateurs profanes) posent également question (Cardon 2010, Pasquier 2014). Dans le système des avis partagés, désormais classique, nous coproduisons ce que nous consommons (Dujarier 2008), mais de manière différenciée. En effet, de façon similaire à l’évaluation en matière culinaire, on observe « une tension propre à l’évaluation profane, puisqu’en définitive sont mis en avant les moins profanes des profanes, les plus professionnels des amateurs » (Beauvisage et al. 2014, p. 201). Ainsi les contributeurs sont-ils différenciés par un statut qui intègre notamment l’intensité de leur participation aux évaluations.
Pour s’en convaincre, il suffit de se pencher sur la manière dont l’entreprise TripAdvisor valorise les données postées par les internautes, avec son fameux algorithme de notation, mais aussi les classements des sites, des villes, et des destinations « préférées » aux échelles mondiale, européenne ou nationale. À partir des requêtes les plus fréquentes des Français sur le site et d’une « enquête en ligne » sur leurs attentes, Artiné Mackertichian, porte-parole de TripAdvisor, nous présente les destinations préférées des « Français » :
Les tendances de la communauté TripAdvisor reflètent ce qui constitue le charme du voyage — l’aventure, les cultures étrangères et la couleur locale. Ce qui dessine une tendance pour cette année : les voyageurs français sont particulièrement attirés (sic) par la combinaison des atouts des grandes villes et des activités de plein air. Pour ceux qui planifient un voyage dans ces villes, les pages de destinations proposées sur notre site (TripAdvisor Londres, TripAdvisor Marrakech…) constituent une mine d’informations en termes de meilleurs hôtels, restaurants et attractions. Consultez-les et profitez d’un voyage excellent [5].
On le voit : ces études de tendances nous en apprennent plus sur la communication de l’entreprise que sur les désirs et les pratiques des internautes. TripAdvisor est propriétaire d’une vingtaine de marques, vient de racheter lafourchette.com, qui en constituait l’antithèse élitiste, et occupe actuellement l’espace médiatique du tourisme avec ses « révélations » presque hebdomadaires sur ses classements en matière d’hôtels, de monuments, de zoos, de plages, etc.
L’enjeu est donc ici de proposer une lecture à partir du site TripAdvisor différente de celle opérée par ses services marketing, mais aussi de ce qui fait sa réputation : la hiérarchisation des destinations et des activités sur la base des notes ou des requêtes. Nous optons pour une approche dite « inclusionniste », c’est-à-dire donnant la même importance à chacun des commentaires et des commentateurs. Dans cette optique, deux entrées principales s’offrent à nous, qu’il faudra bien sûr combiner : l’analyse du contenu des commentaires postés d’une part, celle des informations disponibles sur les posteurs (via les métadonnées), de l’autre. C’est l’enjeu du programme expérimental d’études des traces digitales, que nous menons depuis quatre ans, à la croisée de l’informatique, de la géographie et de la socio-anthropologie (Chareyron, Cousin et al. 2014). Ce travail consiste à extraire les métadonnées et les données accessibles sur différents sites, dont TripAdvisor, mais aussi Hotel.com, Panoramio, Flickr, etc., et à produire des analyses non orientées par des objectifs de marketing, mais en procédant selon une démarche inductive et en inventant des programmes adaptés. Concernant TripAdvisor, les différentes informations disponibles concernent les commentaires, les notes attribuées aux sites (attractions, hôtels, restaurants), croisées avec les métadonnées associées aux commentaires (date de mise en ligne, site associé, langue) et aux commentateurs (pays et ville d’origine déclarée, sexe déclaré, âge déclaré, autres sites visités, nombre de commentaires). Nous travaillons donc sur des données massives : des centaines de milliers de photos, des millions d’informations. Ensuite, nous lançons des requêtes à partir de catégories sociologiques, de données territoriales, ou encore de scansions temporelles… On voit alors se dessiner des concentrations et des dispersions, des flux et des circulations, des récurrences de mots ou d’images. Bref, tels des archéologues, nous travaillons à reconstituer des parcours, des chemins et des itinéraires, dans le temps et dans l’espace, à partir de quelques (millions de) traces, mais aussi de l’histoire de ceux qui les ont laissées. Voyons, à travers quelques cartes, ce que donne l’utilisation de ces données, indépendamment du contenu des commentaires et de la qualité des commentateurs.
Les France des commentateurs.
La deuxième carte constitue une carte par anamorphose, en fonction du nombre de commentaires postés par commune en France. Elle permet de lire une hiérarchisation de l’espace touristique français qui tranche avec celle proposée par TripAdvisor de deux façons différentes. Tout d’abord, cette carte se distingue de l’orientation « activité » du site pour analyser des territoires et faire tenir ensemble attractions, hôtels, restaurants et espaces de shopping. Surtout, sur cette carte, les grandeurs ne sont pas fonction des notes pondérées par l’algorithme, mais des masses : on comprend alors que la France des avis massifs n’est pas la même que celle des avis positifs. Si l’on se penche sur la quantité des avis émis, on voit se dessiner le poids écrasant de la métropole parisienne, comme un gros splash sur la carte de France. Quelques destinations résistent toutefois face à la métropole parisienne, aux extrémités du territoire : littoral de la Côte d’Azur, Provence, Alpes du Nord, Alsace, Lourdes… À l’inverse, une France du vide touristique apparaît par contraste dans le Nord-est lorrain et ardennais, aux franges du Bassin Parisien, et dans la majeure partie du Massif Central. En outre, cette carte présente le ratio Français/étrangers dans les commentaires postés pour chacune des communes françaises. Tripadvisor propose un classement des commentaires par langue utilisée. Nous avons choisi là de retenir plutôt la nationalité déclarée par l’utilisateur. Les commentaires pour lesquels la nationalité n’est pas disponible ne sont pas retenus. Les couleurs sont fonctions des quantiles : en bleu les communes avec la proportion la plus importante de commentaires postés par des Français, en orange foncé les communes avec la proportion la plus importante de commentaires postés par des non-Français (seuils sur le côté droit de la carte). Cette carte générée automatiquement fait apparaître une France des vacanciers français sur le littoral atlantique — les campings de l’ouest —, tandis que la part relative de commentaires issus d’internautes non Français sont plus nombreux à Paris, dans le Val de Loire, la Dordogne, la Normandie des sites de mémoire du Débarquement, et surtout, le sud-est des Alpes et de la Côte d’Azur.
La Carte 3, également centrée sur la nationalité et le ratio Français — étrangers par commune, avec les mêmes couleurs, mais sans anamorphose — montre que la part des étrangers n’est pas fonction seulement de la masse de commentaires. Ainsi, les sites de Champagne, écrasés dans la carte anamorphique, se révèlent-ils fortement internationalisés sur cette carte, qui ne retient pourtant que les communes concernées par au moins dix commentaires dotés de métadonnées sur la nationalité. Mais ceci donne également l’impression d’un grand vide, révélant la forte sélectivité territoriale opérée par les commentateurs de Tripadvisor, qui rend invisible une partie du territoire.
L’âge et le genre du tripadviseur.
La proportion et les caractéristiques des utilisateurs de TripAdvisor varient selon les sites : en fonction de l’origine géographique (voir Carte 2), mais aussi selon l’âge ou le sexe. Dès lors, nous pouvons faire l’hypothèse que ces variations nous disent quelque chose des façons de pratiquer un site, une activité, une destination, et cela à différentes échelles. Ainsi la Carte 4 présente-t-elle, à l’échelle nationale, l’âge moyen des commentateurs TripAdvisor, par commune, selon une division par quantiles. Plus l’âge moyen est élevé, plus la couleur est sombre. Ceci permet une autre géographie que celle de l’opposition Français/étrangers, faisant apparaître une pratique des métropoles françaises plus jeune, et à l’opposé un tourisme dans les espaces ruraux marqué par une moyenne d’âge plus élevée, ou une opposition entre massifs montagneux, entre des Alpes du Nord, avec des TripAdvisers plus jeunes, et le Massif Central.
Ces données peuvent aussi qualifier les pratiques au sein même d’une destination, et permettre de repérer, par exemple à Paris, les activités et endroits comportant la plus grande proportion de femmes parmi les commentateurs, comme l’illustre le tableau suivant :
Ces sites ne sont pas, et de loin, les plus commentés au sein de la destination parisienne. Ils ne sont pas tous touristiques. Ainsi O Kari Hammam est-il évalué dans sa grande majorité par des Franciliennes. En outre, dans certains cas, la dimension genrée est un truisme : le hammam précise « réservé aux femmes ». Par ailleurs, pour savoir si les ratios hommes/femmes sont représentatifs des internautes qui ont posté des commentaires, il faudrait vérifier que les hommes et les femmes ont la même propension à indiquer leur sexe, et ce pour tous les types d’attractions, hôtels, etc. Toutefois, une fois ces réserves prises, un Paris touristique féminin apparaît, polarisé autour d’activités de cours de cuisine et de découvertes culturelles. À l’inverse, les sites avec la plus forte proportion de commentaires masculins sont essentiellement des restaurants et des brasseries. Ces différences, qui nécessitent de passer au grand nombre, relèvent-elles de pratiques touristiques différentes ou de différences dans la façon de hiérarchiser et de raconter l’expérience touristique ? Pour le dire autrement, a-t-on un Paris des filles, qui prennent des cours de cuisine, font risette aux chats, font des activités ludico-culturelles, et un Paris des garçons, qui mangent, remangent, et, peut-être, paient l’addition… ? Ou observe-t-on simplement un récit genré de ce qu’il faut avoir vu, expérimenté, et, surtout, de ce qu’il faut raconter ? Se poser cette question à l’échelle d’une destination, pour l’ensemble des sites, pourrait permettre d’appréhender la dimension sexuée des pratiques et des récits. On le voit, les questions posées comme les résultats valent à la fois pour eux-mêmes et en tant qu’ils mettent sur la voie de nouvelles enquêtes, davantage ethnographiques.
Ainsi, grâce aux informations fournies par les internautes — les métadonnées —, il est possible d’esquisser différentes cartes des pratiques et expériences touristiques basées sur les différences de provenance, d’âge, de sexe, et cela à différentes échelles, des pays ou régions aux communes. Ceci implique un certain nombre de précautions éthiques afin de préserver l’anonymat des informateurs.
Territoires relationnels.
L’usage des données issues de TripAdvisor permet également de caractériser les territoires, à différentes échelles. En effet, pour chaque commune sont commentés trois types de lieux : les attractions touristiques (sites, musées, tours privés, etc.), les hôtels et autres hébergements, les restaurants. Chaque territoire peut donc être défini comme une relation particulière entre ces trois catégories de services touristiques, relation qui dépend à la fois d’une répartition objective (nombre de restaurants, hôtels, musées) et de l’importance relative donnée à chacune des activités, dans l’expérience touristique, comme dans la volonté d’en rendre compte. Il est également possible d’identifier les connexions réalisées par chacun des internautes et de les modéliser. La Carte 5 propose une France des relations entre services touristiques, basée sur le nombre de commentaires par commune, entre l’ensemble des attractions et les hôtels. Cette carte est ainsi celle des hauts lieux touristiques et des communes touristiques dortoirs, bref de la polarisation centre-périphérie de l’espace touristique. En creux, se lisent plusieurs types de relations entre espaces au sein d’une même destination régionale ou locale : entre des espaces de la convoitise et des espaces de la relégation touristique, par exemple.
Pour résumer, TripAdvisor recèle une gamme importante d’informations sur ses utilisateurs, leurs pratiques, leurs récits, mais aussi leur répartition sur le territoire. Ce sont ces traces digitales qui nous intéressent. Évidemment, il est abusif d’aller de ses utilisateurs aux touristes en général : toute une sociologie de l’usage des réseaux sociaux par les touristes est à mener (Chareyron, Da-Rugna et al. 2014). Les touristes anglophones sont les plus nombreux, sans doute plus habitués à l’usage des réseaux sociaux en général et de TripAdvisor en particulier. Une grande partie des touristes dans le monde ne publie pas de commentaires ou ne partage pas ses photos de vacances au-delà de Facebook. TripAdvisor caractérise ainsi une communauté d’utilisateurs que l’on peut tenter de rapporter à une population plus large (les touristes), mais également étudier en soi, dans ses variations. Pour autant, pour le moment, nos cartes correspondent aux résultats des enquêtes de fréquentation touristique classique. Notamment parce que l’échelle est trop petite pour entrer ici dans les détails, elle ne nous apprend pas grand-chose de nouveau sur les fréquentations, mais prouve la légitimité de notre recherche et la validité de notre méthode de production des connaissances. C’est déjà beaucoup, mais l’enjeu est ailleurs bien sûr : il s’agira de s’intéresser aux chemins de traverse, à la manière de les parcourir, de les articuler, et de les raconter.
À l’instar de nombreux réseaux sociaux, mais d’une manière plus cruciale, directe et explicite, TripAdvisor peut être étudié comme une communauté produisant une description singulière, et donc un agencement particulier du monde. En effet, TripAdvisor est bien plus que le simple reflet d’une multitude de points de vue individuels : ce qu’il raconte et représente a des effets performatifs sur l’organisation et l’industrie du voyage, comme sur les pratiques et les expériences vécues par des millions de touristes. Or, ce que nous voyons ici, ce n’est pas une dispersion des flux, mais bien plutôt une hyper-concentration. Ce qui ne nous empêche pas, par ailleurs, d’identifier et de travailler sur les marges et les périphéries de ces concentrations (Chareyron, Cousin et al. 2014). Nous nous sommes ici concentrés sur les métadonnées, mais étudier TripAdvisor suppose également d’analyser le contenu des commentaires, leur statut et ce que ceux-ci nous disent des pratiques, des expériences et des récits touristiques. Masses de plusieurs centaines de milliers de commentaires, aux styles disparates, dans plusieurs langues, sur des registres tout aussi divers (émotions devant un spectacle grandiose, propreté des toilettes, longueur de la file d’attente, etc.), écrits dans des styles hétéroclites, concernant attractions et équipements touristiques du monde entier, mais aussi des restaurants, des boîtes de nuit, des magasins, ce corpus semble encore vierge de toute analyse systématique et nous nous proposons de le défricher. Avec ces quelques exemples, il ne s’agissait donc pas seulement de s’abandonner aux délices du trip-patouillagecartographique, mais de suggérer que nous, chercheurs non orientés par le marketing, commençons seulement à envisager l’étendue des enquêtes possibles, ethnographiques, sémiotiques ou informatiques…