Mon père voulait être un homme de son temps, et un homme de son temps, ça devait vivre au village, sous le soleil, en pleine lumière, pas dans la pénombre d’un sous-bois. Un homme de son temps, ça devait cultiver le seigle, trimer tout l’été comme une fourmi crasseuse pour pouvoir, l’automne venu, fanfaronner en avalant du pain et, ce faisant, ressembler aux étrangers. Un homme de son temps, ça devait avoir une faucille chez soi pour aller se courber dans les champs au moment de la moisson ; ça devait avoir une meule à bras pour y moudre du grain en suant et en soufflant.
Andrus Kivirähk, L’homme qui savait la langue des serpents (2007)
L’enjeu de la différence.
Faute de parvenir à penser le changement [1] — voire de tenter de le faire à cause de leur obnubilation par un passé à ressusciter —, les historiens adoptent le plus souvent une pensée « cassée », qui privilégie des flexions brutales, des cassures, que rend bien visible un vocabulaire émaillé de « crises », « révolutions », « mutations », « tournants », « renaissances », etc. [2] Rares sont par conséquent aussi les contestations de telle affirmation historienne d’une cassure qui ne débouchent pas sur l’affirmation inverse d’une continuité [3], comme si le seul choix était entre la constance ou la rupture [4]. La faute en est, schématiquement, à un défaut de conceptualisation, à l’interférence des logiques académiques dans le champ scientifique et à la nature du matériau classique de l’historien (la documentation écrite).
Défaut de conceptualisation, en effet, dans la mesure où, malgré les observations de Marc Bloch (1937, p. 8) ou, plus récemment, d’Alain Guerreau (2001, p. 252-256), la conception de l’histoire comme la science du changement social n’est toujours pas acquise, ce qui conduit à une démarche plutôt descriptive, au mieux ethnographique, qui se contente pour l’essentiel d’une causalité linéaire [5]. Et comme par ailleurs les autres sciences sociales (sociologie, anthropologie, géographie, économie, linguistique, etc.), dans lesquelles les historiens vont régulièrement récupérer et recycler des concepts, se sont d’emblée construites hors de toute perspective temporelle [6], il devient difficile de penser le changement ou la transformation, sinon par analogie avec des mouvements naturels (l’évolution ou la mutation biologique [7], les mouvements marins de Braudel ou des Toffler, etc.), et sans pouvoir prendre en compte ni le problème des effets des actions humaines (l’interactionnisme se désintéressant de toute façon du cadre macro-social) ni ceux des rythmes, des effets de seuil ou des échelles temporelles [8].
Interférence des logiques académiques, également, puisque cette « pensée cassée » s’accommode bien, il faut le reconnaître, d’une organisation académique de la recherche qui segmente les historiens par périodes et sous-périodes (comme le haut Moyen Âge, le Moyen Âge central ou classique et le bas Moyen Âge). Ceci les conduit usuellement à survaloriser les écarts avec ce qui précède, mais moins fréquemment avec ce qui suit, ce qui permet d’ailleurs de « déborder » vers « l’aval », notamment pour utiliser une documentation plus riche, puisqu’il s’avère que la pente du temps est inverse à la pente documentaire [9]…
Effet de la documentation historique, enfin, en raison de l’inertie qui touche tant les usages langagiers (comme l’écrivait déjà Marc Bloch, « au grand désespoir des historiens, les hommes n’ont pas coutume, chaque fois qu’ils changent de mœurs, de changer de vocabulaire » 1941/42, p. 57, voir aussi p. 137) que les matérialisations régulées (c’est-à-dire non aléatoires), et notamment — pour ce qui est classiquement des historiens — les usages écrits. On a ainsi attiré l’attention sur l’existence de ce qu’on qualifie (à défaut de pouvoir l’expliquer) d’« effets de mode » concernant tant la forme des actes (format et autres éléments de rhétorique visuelle qui encadrent la visibilité, datation et autres formules qui encadrent la légibilité tout comme la langue employée) que le vocabulaire mobilisé (ou, si la documentation est par exemple iconographique, les motifs). Toutefois, là encore, la manière dont travaillent les historiens accentue à l’évidence les effets de rupture : outre le fait qu’ils se focalisent sur certaines catégories de mots (substantifs, verbes, adjectifs et adverbes, aux dépens de ce qu’on appelle couramment « mots-outils » [10]), le changement formel, fondamentalement lexical (apparition/disparition d’une forme d’acte [11], apparition/disparition d’un mot ou d’un syntagme [12]) sur lequel se focalisent les historiens n’est en effet que la façon la plus simple (sinon simpliste) de repérer des différences susceptibles d’être signifiantes, par comparaison d’ensembles documentaires plus ou moins importants à une échelle temporelle unique (par exemple, à l’échelle d’une période de quelques décennies).
Plus compliquée (ou exigeante), en revanche, est l’approche sémantique, par le repérage des modalités (et des échelles) d’usage des formes en question (par exemple les associations ou oppositions sémantiques) dont on peut postuler qu’étant moins visibles et donc moins conscientes [13], elles formalisent de manière plus fine les pratiques sociales (sans qu’on ne puisse jamais y voir une traduction directe, ce qui d’ailleurs reviendrait à négliger le sens social spécifique des formalisations). Bref, il s’agit de procéder à un repérage d’inflexions de détail — ou alors des échelles pertinentes de ces modifications — sans se laisser abuser par les phénomènes les plus visibles, un peu comme lorsque les archéologues cessèrent de ne s’intéresser qu’au dégagement des structures bâties et des artefacts remarquables, aux dépens non seulement des autres restes mais aussi de l’enveloppe matérielle et spatiale [14].
Toutefois, il ne saurait être question de substituer l’approche sémantique à l’approche lexicale : les changements lexicaux ne sont pas moins vrais que les changements sémantiques — simplement, on peut postuler qu’ils correspondent à une temporalité du changement plus lente, comme le signalait d’ailleurs Marc Bloch, avec une plus grande inertie, ou moins de souplesse, et donc des effets de rupture avant/après plus nets. On devrait donc concevoir qu’il existe une temporalité complexe du changement, à plusieurs échelles de temps (et pas seulement à plusieurs échelles de l’espace social [15]) — idée d’une temporalité multi-scalaire usuellement totalement négligée par les historiens, qui se sont installés depuis longtemps dans un temps long conçu comme une addition de temps particuliers [16].
On pourrait multiplier les exemples de telles ruptures postulées à défaut de penser une transformation (qu’il resterait évidemment à expliciter). C’est ainsi le cas de ce qu’on appelle couramment la « révolution documentaire du 12e siècle » [17]. Les facteurs de rupture retenus pour cette « révolution » sont fondamentalement de nature politique [18] : la mise en place de la royauté anglo-normande dans la seconde moitié du 11e siècle et celle du régime communal en Italie au 12e siècle, le renforcement de la royauté capétienne au cours du règne de Philippe Auguste devant avoir produit, plus tard, des effets scripturaux similaires. Le risque était grand, dès lors, que cette « révolution » fût un fantasme historien, inconsciemment destiné à accentuer le caractère de rupture du phénomène politique en question. En tout cas, des contestations du caractère « révolutionnaire » de la culture de l’écrit élargie se sont multipliées, tant de la part de spécialistes des périodes antérieures que de Michael Clanchy lui-même, qui soulignent tous l’importance de la période carolingienne du point de vue scriptural [19]. Ceci ne revient pas à nier ou négliger l’apparition, vers le 12e siècle, de nouvelles formes de production d’écrits (d’une manière générale les registres, qu’ils soient notariés, de chancellerie, comptables, etc.) ou encore d’usages écrits des langues vernaculaires, qui signalent un processus particulier à l’œuvre, mais invitent également à s’interroger sur des transformations sociales à plus long terme, au-delà du seul contexte des ruptures « politiques » visibles.
La même chose peut être dite à propos du phénomène sur lequel je vais ici m’attarder, à savoir la formation de ce que j’appelle désormais les « communautés d’installés » (ex-« communautés d’habitants »). L’examen de cette transformation [20] a en effet été initié dans une perspective historique où les 11e-12e siècles jouaient le rôle de moment de bascule, affectant l’organisation religieuse (cimetières, paroisses, confréries, etc.), l’organisation économique (achèvement du passage du grand domaine carolingien à la seigneurie) et l’organisation politique (reprise en main par les pouvoirs souverains, apparition du pouvoir urbain) [21]. Sans chercher à nier que des changements se produisent à ce moment-là, en tout cas dans la documentation écrite, la question qu’il conviendrait de se poser concerne le gain explicatif éventuel lié à un changement d’échelle temporelle : et si, au lieu de représenter une rupture par rapport à ce qui précède (disons, les 9e-10e siècles), le phénomène des « communautés d’installés » était plutôt la poursuite, sous des formes éventuellement particulières, d’un phénomène de transformation bien plus profond ?
Il n’y a là aucun « continuisme » puisque d’une part, je postule d’emblée que la société des 9e-12e siècles (pour en rester aux siècles que je viens de mentionner — mais je ne m’y limite en aucun cas) est une société qui se transforme, et que d’autre part, il ne s’agit absolument pas de considérer que les changements formels ne sont que superficiels. Mon problème est à la fois d’essayer de comprendre la dynamique interne de la société médiévale (qui engendre les « communautés d’installés ») et de distinguer un peu mieux les différentes échelles de transformation (et notamment celle à laquelle renvoie tendanciellement la documentation écrite). À propos des Yanomami de l’espace amazonien, Catherine Alès (1990) signalait en effet qu’en fonction de l’échelle temporelle d’observation adoptée, les résultats de l’étude étaient radicalement différents quant à l’importance relative des forces de fission et des forces de fusion, négligence des variations d’échelle de temps qui explique, par exemple, qu’on ait pu prêter aux Yanomami une structuration lignagère alors que la parenté y est cognatique…
Si l’on se focalise sur les « communautés d’installés », c’est-à-dire sur la seule explication de leur formation, alors autant reconnaître qu’on travaille sur leurs « origines », dans une perspective téléologique : la fin du travail correspond au moment où les communautés existent, et l’échelle de travail est essentiellement celle de la communauté elle-même, avec des durées variables d’une région à l’autre et d’une communauté (rurale ou urbaine) à l’autre. On n’a donc guère expliqué le processus de manière historique, ni dans sa généralité ni dans sa variance (systémique et non pas idiosyncrasique [22]). Comment adopter alors une perspective différente, à une autre échelle spatio-temporelle, où les particularités locales cesseraient d’être des formes absolues pour devenir signifiantes ? À moins de poser qu’une communauté particulière puisse être considérée comme le modèle réduit parfait (mais comment le pourrait-on ?) ou que le tout n’est que la somme de ses parties (donc en l’occurrence qu’il suffirait de multiplier les études de cas de communautés, selon la logique du puzzle), je vois mal comment faire autrement que de procéder par l’examen de processus sociaux abstraits — non pas au sens de « non concret », mais renvoyant à un niveau supérieur de généralité — sans pour autant que cela détourne de l’examen de cas particuliers, étudiés cependant non pour eux-mêmes mais pour l’échelle particulière qu’ils procurent, dans un incessant va-et-vient qui fonde précisément la démarche scientifique [23].
La dynamique historique qui se traduit notamment par la formation des « communautés d’installés » reste toutefois actuellement obscure. Non seulement le programme de leur étude n’en est pour l’instant qu’en cours, dans une phase toujours exploratoire non seulement de l’objet, mais aussi de la manière de l’aborder — mais ni là ni ailleurs n’existe actuellement un corps d’hypothèses articulées concernant la mise en œuvre d’échelles temporelles variées. Le seul progrès net jusqu’alors enregistré découle de la prise au sérieux de la dimension spatiale du phénomène examiné —, ce qui suggère que la prise en compte de la dimension temporelle pourrait s’avérer tout aussi déterminante. S’agissant d’une dimension spatiale abstraite (et non de l’analyse spatiale de telle ou telle communauté), le privilège à accorder à tel ou tel type de communauté (la ville ou le village par exemple) est lui-même rigoureusement fonction du choix théorique initial, et non pas du discours dominant — du point de vue de la structure documentaire ou de la fréquence académique. En l’occurrence, j’inverserai ici la démarche usuelle qui consiste à regarder les campagnes à partir de la ville, en considérant ainsi la communauté villageoise comme une sorte de « paradigme » [24], à savoir de la définition d’un nouveau mode de structuration sociale — en postulant donc que c’est la communauté villageoise qui permet d’éclairer la nature sociale de la communauté urbaine…
L’enjeu de l’installation.
La formation des « communautés d’installés » comme définition d’un espace-temps dominé et fictivement endorégulé.
Que toute communauté villageoise (ou urbaine) ait une certaine spatialité, cela va de soi. Ou plutôt : cela devrait aller de soi — à l’encontre de l’approche strictement interpersonnelle, réticulaire, du phénomène communautaire médiéval. L’exemple classique en est fourni par l’ouvrage fameux de Pierre Michaud-Quantin sur « le mouvement communautaire » (1970), ou encore par les travaux (notamment allemands) d’historiens s’appuyant sur lui (Oexle 1979, 1982, 1992) ou d’historiens du droit (Bader et Dilcher 1999, p. 504-519) qui conçoivent la formation des groupements sociaux de manière principalement interpersonnelle : par le serment mutuel, la commémoration des morts, le repas commun, etc. — c’est-à-dire sans aucun rapport à l’espace. C’est ainsi que le serment mutuel, auquel un certain nombre d’historiens, à la suite de Max Weber, prêtent une importance décisive dans le cadre de l’étude du mouvement communautaire, est traité comme un acte interpersonnel — en oubliant qu’il s’agit aussi d’un acte spatialisé puisque le serment était prêté non pas à des personnes en tant que telles, mais envers les gens ou habitants de tel lieu.
Mais même lorsque l’espace n’est pas éliminé par une approche abstraite (juridiste ou d’inspiration weberienne), il n’en est pas pour autant vraiment pris en compte puisqu’il est traité comme simple substrat, au mieux comme une ressource, en tout cas en tant qu’espace physique et neutre, étendue bidimensionnelle et amorphe sur laquelle viendraient s’implanter des bâtiments en groupe plus ou moins compact, ou alors se dérouler des activités de surface (agriculture, etc.), bref « l’espace » du sens commun (ou le « site » du déterminisme géographique) [25].
Ici à l’inverse, l’espace communautaire est conçu en tant qu’espace social : non pas le déroulement du social dans un espace amorphe et lui préexistant, mais bien plutôt une réalisation spatiale du social — en l’occurrence, l’élaboration d’un nouveau rapport spatial au social (car un rapport social à l’espace est un truisme). Ce nouveau rapport spatial au social est perceptible à l’historien sous deux aspects : les pratiques spatiales et la conception des rapports sociaux par l’intermédiaire d’une référence à un lieu. Les rapports entre personnes sont exprimés (formalisés) et donc réalisés par l’intermédiaire de leur rapport particulier à tel ou tel lieu [26]. Bref, ce n’est pas que le social devienne spatial, ou plus spatial qu’avant, c’est que désormais, l’espace devient visiblement le référent essentiel pour l’organisation sociale.
Du côté des pratiques spatiales, on mentionnera les transformations à long terme (du 9e au 13e siècle) de l’espace habité (pétrification, immobilisation, polarisation) que révèlent les fouilles archéologiques et la configuration décisive, dans la documentation écrite postérieure au 10e siècle, de l’espace ecclésial et cimetérial en tant que lieux spécifiques (Sablonier 1984, Fixot et Zadora-Rio 1989, Fabre 1996, Galinié et Zadora-Rio 1996, Lauwers 1999 et 2005a, Zadora-Rio 2003a, 2003b, 2009, Iogna-Prat 2006, Méhu 2008). On se gardera cependant de négliger le problème compliqué d’une éventuelle réorganisation morphologique agraire ayant engendré décisivement le paysage agraire européen antérieur à la Révolution industrielle dont, en définitive, ne sont aujourd’hui plus assurées ni la distribution géographique des formes (openfield, champs compacts, bocage, etc.), ni la datation de ces formes, ni les modalités sociales de leur mise en œuvre en fonction de l’échelle d’analyse (paysannes ou seigneuriales, planifiées ou spontanées, arpentées ou non) [27]. Qui plus est, il n’est même pas certain que cette mise en place du paysage agraire ancien puisse être conçue comme un moment d’inflexion particulier — comme cette phase des « grands défrichements » qui serait plutôt une illusion d’historien produite à partir de corpus écrits dont on n’a pas pris en compte les modifications de logique scripturale et archivistique (apparition des fonds cisterciens, etc.) : à l’échelle du travail des archéologues, les « grands défrichements » disparaissent en tant que flexion nette pour n’être plus qu’une étape parmi d’autres de formation du paysage (Burnouf 2008).
Par ailleurs, on observe au plus tard, à partir du 12e siècle, le développement massif d’un ensemble de discours qui révèlent ce qu’on peut appeler un processus de formalisation spatiale du social. En témoignent ainsi, pêle-mêle, le changement de sens de la christianitas, qui passe de l’ensemble des chrétiens à la terre chrétienne (Iogna-Prat 2001, Nagy 2005) ; l’apparition et la diffusion (et pas seulement chez les aristocrates) des anthroponymes toponymiques (Bourin 1990-2008, Martin et Menant 1994-1998, Martinez Sopena 1995, Bourin, Martin et Menant 1996) ; la substitution de l’indication du lieu de résidence des dépendants à celle du seigneur dont ils dépendent (par exemple, les « bourgeois de Paris » au lieu des « bourgeois du roi »), ou encore la substitution de la mention de l’espace dominé à celle des hommes dominés (par exemple, « la Francie » au lieu de « les Francs », voir Morsel 2000b) ; l’enracinement spatial du pouvoir seigneurial [28], dont la notion de « topolignée » rend bien mieux compte que celle de « lignage » (Guerreau-Jalabert 1994, p. 314).
Ces transformations locales, dont la temporalité (date et rythme) n’est pas absolument nette, mais qui semblent se placer pour l’essentiel entre le 10e et le 12e siècle, sont elles-mêmes articulées à des changements plus larges (dans l’espace comme dans le temps), comme les réflexions théologico-philosophiques sur la nature du locus (Aertsen et Speer 1998), la constitution d’une « géographie de l’au-delà » (Le Goff 1981) ou encore, à mi-chemin entre pratique spatiale et discours spatial, l’évolution de l’espace pictural (qui s’homogénéise et s’étend au-delà des positions particulières) à l’amont de l’introduction de la perspective (Schmitt 2007). Ainsi, les rapports entre hommes sont désormais conçus indissolublement comme des rapports entre lieux et vice versa : il n’y a aucun rapport entre lieux qui ne soit en même temps un rapport entre hommes — parce que les lieux n’ont pas d’existence autre que sociale, certes, mais surtout parce que le système social a fait, pour reprendre la distinction opérée par Augustin Berque (2000, 2003), du locus une chôra et non plus un topos.
La conséquence, au niveau villageois, de cette transformation des rapports sociaux et spatiaux est la formation de nouveaux rapports sociaux, dotés d’une spatialité inédite, qui a été conçue dans un premier temps sous l’angle de l’« habiter » — le processus étudié étant en fin de compte la conversion des dépendants en « habitants ». Dans l’expression usuelle de « communauté d’habitants », on a ainsi tort de n’accorder d’attention qu’au premier segment, comme si le fait d’être « habitant » allait de soi : la question qui se pose est non pas « comment » mais « pourquoi désormais les hommes habitent-ils ? » — à l’encontre de l’approche classique, y compris chez les historiens, de l’« habitat » comme d’une constante humaine : la satisfaction d’un besoin primordial d’abritement (mis sur le même plan que le besoin de se nourrir et de se vêtir), dont seule la réalisation pratique changerait (de la grotte au gratte-ciel) et traduirait des évolutions sociales (souvent réduites à de simples progrès techniques) [29].
Il ne s’agissait donc ni d’une façon différente (nouvelle) de réaliser cette prétendue constante anthropologique, ni d’un simple usage différent (nouveau) des mots médiévaux (latins ou vernaculaires) pour « habitant » ou « habiter », mais d’une façon différente (nouvelle) de concevoir les rapports sociaux par l’intermédiaire d’une référence à l’espace — en l’occurrence, la configuration des rapports de domination en référence à un lieu, ce que j’ai appelé plus haut « conversion des dépendants en habitants ». Toutefois, afin d’éviter plus sûrement la rétrojection à la fois de nos conceptions triviales de « l’habiter » contemporain et d’une conception de « l’habiter » comme constante anthropologique (ou géographique), il me semble désormais préférable d’envisager le processus en question comme la formation de « communautés d’installés ». La notion d’« installation » présente en effet comme avantages de n’être pas d’utilisation courante, d’exprimer un rapport spatial dynamique (grosso modo : venir habiter, passer d’un auparavant ailleurs à un désormais ici) et d’évoquer un champ lexical médiéval à la fois très riche et mal étudié : sedes et ses (faux) dérivés possidere, possessio, ainsi que leurs équivalents vernaculaires [30].
C’est donc sur « la conversion des dépendants en installés » qu’il convient de s’interroger, ce qui ne signifie ni que les dépendants disparaissent, au contraire (leur dépendance est assurée par leur appartenance à la « communautés d’installés », leur accès au statut d’exploitant dépendant étant médiatisé par le fait d’être « installé ») ni qu’auparavant les dépendants vivaient de façon dispersée. Antérieurement, en effet, à l’époque carolingienne notamment, on pouvait bien sûr rencontrer des agglomérations plus ou moins denses d’agriculteurs, mais ceux-ci exploitaient chacun un ensemble particulier de terres, libre ou dépendant de maîtres à chaque fois distincts qui les contraignaient alors à venir travailler la moitié du temps sur leurs propres terres (ce que les historiens appellent en général les « corvées », voir Demade 2004, Devroey 2005, p. 137-141). Ces agglomérations, lorsqu’elles existaient, juxtaposaient ainsi des cultivateurs théoriquement sans liens entre eux, nouant des mariages avec les autres cultivateurs de leur maître installés dans d’autres agglomérations (et non pas avec leurs voisins), et qui ne se concevaient que comme les « hommes » de leur maître, comme les membres de sa familia.
Cette juxtaposition de populations dépendantes « exofocalisées » (avec d’importants déplacements « pendulaires » à l’échelle hebdomadaire) laisse la place, selon des modalités dont les causalités et rythmes restent encore méconnus, à un voisinage effectif (coprésence interactive) de populations « localisées », « installées » qui, tout en continuant de relever de maîtres (que les historiens, pour marquer la différence, appellent en général « seigneurs ») différents (mais de plusieurs en même temps pour des droits différents), sont désormais interdépendants. Cette interdépendance présente d’une part une dimension productive : outre l’existence de contraintes collectives concernant les modalités spatiales et temporelles d’usage du finage (y compris la vaine pâture), qui sont loin de se rencontrer partout, il y a surtout ce que Ludolf Kuchenbuch a qualifié de « structure symbiotique » (2014, p. 91), avec de gros exploitants qui recourent au travail des plus petits lors des travaux agricoles et leur prêtent ou leur louent des bêtes pour leurs propres travaux [31].
Par ailleurs, il y a désormais aussi une négation des distances parentélaires antérieurement entretenues, avec d’un côté l’ensevelissement groupé des défunts du village au lieu des ensevelissements dispersés antérieurs (Galinié et Zadora-Rio 1996, Lauwers 1999, 2005a, Zadora-Rio 2003b), dont la localisation était justement déterminée par les apparentements distincts, ou encore des cimetières en rangées hors des lieux d’habitation, dans lesquels les alignements réalisaient les rapports interpersonnels antérieurs, dont ceux fondés sur la parenté [32]), et de l’autre la conclusion possible de mariages au sein du village [33]. C’est en effet certainement dans cette perspective qu’il convient de comprendre la multiplication aux 12e-13e siècles des actes dits d’« affranchissement » (abolition de pratiques serviles concernant notamment les restrictions matrimoniales et d’héritage, dont le nom indigène, le formariage et la mainmorte, suffit souvent à signaler le caractère irraisonné et historiquement condamné) : non pas sous un angle juridique et comme signe d’une faiblesse seigneuriale (face aux dépendants, à la concurrence de la ville ou au besoin croissant en monnaies), mais en tant que facteur nécessaire à l’enracinement des populations, libres désormais d’organiser elles-mêmes leur reproduction (biologique et sociale), c’est-à-dire de se stabiliser localement, au plus grand profit des seigneurs, dont l’appropriation des terres est ainsi garantie, en vertu du « principe de Carabas » [34].
Les déplacements des dépendants deviennent pour l’essentiel une déambulation au sein du finage au sein duquel ceux-ci ont leurs terres et des biens d’usage commun (bois ou landes), pour la défense desquels ils peuvent s’opposer aux communautés voisines — avec lesquelles, à d’autres échelles, ils peuvent très bien collaborer (ce que montre bien Leturcq 2001, 2007), ce qui suggère que la communauté ne se définit pas par des limites intrinsèques et univoques (dont le paradigme serait notre notion de « frontière ») mais à des échelles variables, bien qu’à l’encontre des communautés voisines à l’échelle considérée. Cette déambulation des hommes (sur les chemins) trouve elle-même son pendant dans la déambulation des bêtes dans les champs lors de la vaine pâture — ces deux phénomènes (déambulation et médiation animale) formant très certainement un véritable système d’appropriation de l’espace, puisqu’on retrouve aussi celui-ci au cœur du grand rite aristocratique qu’a été la chasse féodale [35].
À cette déambulation (qu’on pourrait qualifier d’« endorégulée » [36]) est surimposé un système de déplacements polarisés, à des échelles variables, exorégulés et ciblés sur un locus (église ou résidence seigneuriale) où ils sont destinés à la rencontre périodique et obligatoire entre dominus et homo (seigneur et homme, herr et mann, etc.) — c’est-à-dire à la réactivation régulière, lors des jours de fête ou de la messe dominicale, du pèlerinage, du versement des redevances [37], etc., du rapport social de base de cette société, valable tout autant pour les chrétiens face à dieu que pour les dépendants agricoles face à leur maître… Ce système de déplacements polarisés et obligatoires, périodiques et instaurateurs d’un contact entre S/seigneur et homme, correspond au phénomène du transitus étudié par Didier Méhu (2007) [38].
Le complément de ceci est, fort logiquement, la disqualification de ce qui pourrait constituer des lieux de polarisation « sauvage » : lieux où est rendu un culte non autorisé et donc qualifié de « superstitieux », qui provoque une condamnable affluence [39]. Il n’est pas à exclure qu’elle fût aussi disqualifiée en tant que déplacement désordonné, fondé non sur la marche mais sur la course, si l’on en croit la manière dont elle est désignée en Allemagne : concursus [40], zulauf ou laufen (Dünninger, 1961/62, p. 56-57). Seule une étude lexicale et sémantique précise permettrait cependant de valider (ou d’infirmer) cette supposition concernant la forme attribuée à ces transitus disqualifiés.
On voit bien, en tout cas, combien la dimension spatiale ne peut être séparée de la dimension temporelle : ce qui est instauré est non seulement un réseau, mais aussi un rythme de déplacements qui fondent une spatio-temporalité répétitive (on pourrait même dire itérative, en faisant jouer la parenté des mots iter et iterare), et dont la répétitivité même signale la nature dominée de ceux qui y sont soumis [41]. On a donc affaire à la mise en place d’un espace-temps dominé, itératif et exorégulé — ce qui contraint à s’interroger sur la réalité de l’« endorégulation » qui semble caractériser la déambulation dans le finage.
Ceci devrait alors nécessairement conduire à questionner le rapport couramment établi entre formation des « communautés d’installés » et résistance sociale via l’assimilation des formes d’organisation horizontale à des modes de lutte (selon le principe que « l’union fait la force ») : cette conception est à l’arrière-plan de la lecture « communaliste » du phénomène de formation des communes, due aux historiens bourgeois au 19e siècle suivis en cela par les acteurs de la Commune puis encore par maints historiens du 20e siècle, et qui a été théorisée par Peter Blickle, précisément sous le nom de « communalisme », dans lequel celui-ci reconnaît explicitement le « noyau primordial du politique en Europe » (2000, tome 2, p. 359) [42]. D’une part, une telle lecture « inversée » (la communauté villageoise pensée comme mode de résistance alors que c’est un mode d’encadrement) illustre les difficultés de compréhension de la société féodale à partir de nos représentations du politique contemporain, mais elle conduit aussi à s’interroger plus avant sur le problème paroissial dans la mesure où l’appropriation du curé par la communauté villageoise figure en bonne place dans les ressorts du communalisme.
La paroisse, paradigme de la distinction « personnel versus spatial » ?
Or, au-delà du rôle clé de l’église dans la définition de l’espace-temps itératif évoqué, la question de l’articulation entre la « communauté d’installés » et la paroisse se pose aussi en raison des logiques parentales en jeu. On a vu en effet que le processus de formation des « communautés d’installés » est corollaire d’un processus par lequel les rapports de parenté sont soumis à (en l’occurrence instrumentalisés au profit de) la reproduction de la communauté spatiale, et ce idéellement (anthroponymie, ensevelissement commun — deux pratiques destinées à produire l’idée d’une communauté de destins) comme pratiquement (cadre pertinent de conclusion des alliances matrimoniales) [43]. Ceci se replace dans un contexte plus large de désarticulation des solidarités parentélaires par les contraintes exogamiques massives auxquelles la société occidentale chrétienne a été soumise à partir de l’époque mérovingienne à l’instigation de l’Église, en l’occurrence les évêques, dont le discours se radicalise encore au 21e siècle [44].
C’est d’ailleurs dans le cadre des « communautés d’installés » que ce contrôle s’organise de plus en plus, avec la collaboration des habitants eux-mêmes (publication des bans de mariage, visites pastorales, charivari, etc.). S’ajoute à cela la promotion de formes d’organisation alternatives à la parentèle charnelle : le modèle de la famille conjugale (dont la pertinence sociale est garantie à la fois par le modèle matrimonial et par les systèmes de recensement d’obligations matérielles puis fiscales centrés sur le manse puis le « feu »), et la parenté spirituelle — fondée sur le baptême qui non seulement déclasse symboliquement la naissance charnelle, mais en outre crée ipso facto un rapport de parenté entre tous les chrétiens (dits « prochains », proximi), qui n’exclut pas des proximités spirituelles plus marquées dans le cadre du parrainage ou des confréries (Guerreau-Jalabert 1989, 1990, 1995, 2007).
Ceci implique donc d’examiner plus précisément les rapports entre l’appartenance à la « communauté d’installés » et l’appartenance à la paroisse, souvent posées comme coextensives (ou les deux faces d’une même médaille) [45]. L’avis à peu près unanime règne désormais sur la mise en place ou (là où avaient été mises en place, au haut Moyen Âge, les structures larges et lâches des proto-paroisses — Urpfarreien, pieve et plous) le véritable avènement du système paroissial à partir du 11e siècle [46]. On observe donc une synchronie au moins grossière entre le moment de la formation des « communautés d’installés » et celui de la formation du « maillage » paroissial — sans pourtant qu’on puisse considérer que la correspondance stricte entre les deux formes soit la situation normale : encore au 15e siècle, les cas ne sont pas rares de villages qui relèvent d’une église paroissiale localisée dans un autre village [47], sans parler du cas des villages qui changent de paroisse un an sur deux [48]. Tout ceci justifie encore plus de s’intéresser aux rapports entre les deux appartenances.
Or le concile de Latran IV (1215), en particulier en son fameux canon 21 Omnis utriusque sexus [49], manifeste clairement une dimension personnelle et directe du rapport entre le curé et le fidèle : la confession et la communion annuelles obligatoires à son proprius sacerdos focalisent nettement le fidèle sur son curé (Héfélé 1913, p. 1350-1351). On souligne cependant rarement — ou alors de manière purement technique ou juridique (protéger le fidèle) — le complément apporté à ceci par la fin du canon, consacré au secret de la confession : en imposant le secret absolu de la confession [50], le canon achève de faire de la confession un lien absolument unique, unissant deux personnes non interchangeables jusqu’à leur mort. Ce canon, s’inspirant lui-même de réflexions élaborées dans les décennies précédentes, construit ainsi le lien paroissial comme un lien strictement interpersonnel [51]. La paroisse apparaît ainsi comme un espace social constitué par les liens récurrents entre curé et fidèles, liens sacramentels, mais aussi, indissolublement, liens matériels spiritualisés (casuel, dîmes) [52], dont la schématisation graphique (voire Illustration 1) devrait être celle d’un faisceau radiant convergeant vers un point nodal constitué par l’église et le curé, tandis que l’église paroissiale voisine est interdite même aux habitants pourtant plus proches d’elle.
On doit alors s’interroger de nouveau sur le mode d’articulation entre la paroisse et la « communauté d’installés », dans la mesure où celle-ci se définit précisément par la négation, on l’a vu, des statuts individuels et des liens personnels spécifiques entre seigneurs et dépendants au sein de la « communauté d’installés ». La non-redondance des deux formes d’appartenance que sont la paroisse et la « communauté d’installés » s’exprime clairement à travers les effets de la pratique de l’excommunication, qui exclut de l’accès aux sacrements (et au cimetière) mais pas de la « communauté d’installés » — au contraire de ce qui se passe, par exemple, dans les communautés juives à la même époque, mais où, justement, c’est la communauté elle-même qui « excommunie » (Graboïs 1977, p. 550-551), et non pas le rabbin, qu’une analogie superficielle et fallacieuse pourrait faire considérer comme l’équivalent juif du curé [53]. Il n’y a donc pas correspondance directe entre appartenance à la « communauté d’installés » et participation au culte.
En outre, on note aisément que paroisse et « communauté d’installés » relèvent de deux modèles de spatialité radicalement distincts. Si l’on admet que le facteur de composition de la paroisse est le monopole sacramentel (et notamment « confessionnel ») qui focalise les fidèles sur leur curé et leur église, monopole matérialisé par le casuel et renforcé par l’attraction possible exercée sur les fidèles par les morts sur lesquels l’Église met progressivement la main (reliques de « super-morts » — les saints — dans l’autel, morts « normaux » dans le cimetière) [54], on n’observe pas de principe de démarcation par rapport à l’extérieur (qui joue un rôle crucial dans les « communautés d’installés », j’y reviendrai). L’interdiction canonique qui est faite aux fidèles d’aller voir ailleurs et au curé de les accepter ne constitue en effet en aucun cas une démarcation/protection vers l’extérieur : ici, ce n’est pas la pénétration qui est contrôlée, mais la sortie, avec comme justification de protéger les prérogatives de chaque curé.
Par conséquent, ce n’est certainement pas un hasard si la paroisse ne peut être que très secondairement (et rarement) définie comme un espace délimité. D’une part, les limites paroissiales restent très souvent indéfinies jusqu’au 18e siècle (Iogna-Prat et Zadora-Rio 2005, Zadora-Rio 2008) — non par incapacité des féodaux, mais parce que ça n’a guère d’importance (puisque la paroisse n’est pas un territoire) —, ce qui explique aisément que les actes de fondation de paroisses, qui se multiplient à partir du 12e siècle, ne se préoccupent pour ainsi dire jamais de définir les limites de la nouvelle paroisse : on se contente de signaler précisément le centre et les devoirs qui incomberont aux fidèles envers le curé [55]. Antérieurement au 12e siècle, les actes conservés (notamment dans une région bien documentée comme la Catalogne, mais pas seulement) se préoccupent de définir, de diverses manières, un espace doté d’une immunité et donc protégé vis-à-vis de l’extérieur, alors que la paroisse est définie par rapport à son intérieur (son centre comme pôle d’attraction et l’interdiction faite aux paroissiens d’aller ailleurs). D’ailleurs, l’examen systématique mené sur le registre de visite pastorale du diocèse d’Eichstätt (1480) montre très clairement que le mot « limites » n’est jamais utilisé pour la parrochia (très souvent mentionnée), mais uniquement pour les ecclesiæ (au mieux, certaines ecclesiæ parrochiales) — comme si ce qui avait des limites, c’était le centre/pôle, le siège de la cure (Morsel 2011).
Par conséquent, les limites renvoient non pas à des « limites », mais plutôt à un « ressort », c’est-à-dire l’extension du pouvoir, le rayon d’action du curé ou, métaphoriquement, le rayonnement à partir du centre/pôle qu’est l’église : les limites sont pensées par rapport au siège d’exercice du pouvoir, et leur transgression est donc conçue de manière centrifuge, sous l’espèce du débordement et non de l’invasion. Les termini ou fines (autres termes possibles pour « limites », bien qu’à Eichstätt ces mots n’aient qu’un sens temporel) devraient également être conçues ainsi, comme l’endroit où se termine, se finit le rayonnement de l’église. Ce qui définit une paroisse, ce ne sont donc pas ses limites, mais la focalisation des fidèles sur un même curé et son église : le paradigme dedans/dehors joue uniquement « au centre », au niveau de l’accès à l’église et au cimetière, et non pas au niveau de la paroisse elle-même.
On perçoit ainsi clairement toutes les différences qui existent entre la « communauté d’installés » et la paroisse, même lorsqu’elles concernent les mêmes personnes : la « communauté d’installés » a pour objet la reproduction physique des feux et de leur interrelation, tandis que la paroisse est destinée à la reproduction spirituelle des fidèles individuels [56]. Pour reprendre la terminologie de la Somme dite d’Alexandre de Halès, vers 1235/45, la paroisse serait alors une communio spiritualis, tandis que la « communauté d’installés » formerait une communio corporalis [57]. Il n’y a ainsi aucune nécessité, théorique ou pratique, à la coextensivité [58], ni à l’équivalence des modes de déplacement (déambulation dans le finage versus transitus), sinon notre conception de la circonscription administrative (c’est-à-dire étatique, territorial), ou encore de la « cellule » – évidemment présente dans l’« encellulement » de Robert Fossier.
Paroisse et « communauté d’installés » sont donc de deux natures sociales différentes, et parler de « communauté paroissiale » en parallèle à « communauté d’installés » expose à de graves contresens (sauf à rajouter à chaque fois et selon les cas les adjectifs spiritualis ou corporalis du Pseudo-Alexandre) [59]. « Communautariser » la paroisse conduirait en effet à faire disparaître le fait que l’on a affaire à la mise en place d’un ensemble de pôles (loci) qui non seulement structurent l’espace chrétien (nœuds d’un réseau), mais surtout constituent les points de passage obligatoires (ou points de transitus). Cette polarisation, que Michel Lauwers (2005a) qualifie d’inecclesiamento en raison du rôle central de l’É/église, pourrait ainsi avoir produit un ancrage spatial des populations dans la mesure où se produisait une affectation quasi automatique de l’habitant à un lieu de culte et d’inhumation précis. L’inecclesiamento pourrait alors être considéré comme une nouvelle forme d’adscriptio glebae et donc de réduction invisible de la liberté de mouvement théorique, bien que cette réduction consistât en une fixation douce fondée sur l’attrait du sacré « au centre » (le fameux « esprit de clocher »).
En effet, bien que les paroissiens fussent assignés à telle ou telle paroisse selon leur lieu de résidence dans tel village — ou, en ville, dans telle rue —, leur changement de lieu de résidence conduisait au changement de paroisse. Car le déplacement restait toujours possible et réel : on observe de fait que les populations médiévales ne cessent de bouger, non seulement pour aller au marché ou en pèlerinage ou pour se marier, mais aussi sur les terres, dès lors que l’on dispose des documents permettant de suivre nominalement les tenanciers [60]. L’immobilisme des sociétés rurales occidentales et l’attachement des paysans à la terre de leurs ancêtres ne sont en effet qu’une construction idéologique du 19e siècle [61]. La polarisation paroissiale ne signifiait par conséquent en rien une réduction de la liberté de déplacement individuelle (ce qui est congruent avec la vague d’« affranchissements » susmentionnée), mais la garantie d’une présence humaine continue — ce qui ne signifie en aucun cas des mêmes personnes —, parce que tous les lieux de culte et d’ensevelissement seraient tendanciellement fréquentés en raison de leur attractivité produite par leur conception comme lieux d’accès au sacré. On a donc ainsi affaire non pas à une polarisation des personnes, mais à une polarisation du mouvement de ces personnes — dont le pèlerinage est peut-être la forme exemplaire, le transitus, en tout cas le paradigme. L’apparente contradiction entre polarisation et mouvement se résout ainsi pour ainsi dire d’elle-même dès lors qu’on n’assimile pas polarisation et immobilisation. L’inecclesiamento ne doit donc pas être considéré comme un phénomène d’immobilisation des populations — et donc la connotation carcérale de l’« encellulement » s’avère inadéquate.
Quant au rapport entre cette mobilité polarisée et l’organisation de la production dans le cadre communautaire, on comprend aisément que la polarisation spatiale correspondait parfaitement à la nécessité de la présence d’hommes sur les terres, comme condition sine qua non de la production, mais aussi de l’appropriation seigneuriale des terres selon le « principe de Carabas », transformant ainsi les agriculteurs en dépendants paysans [62]. Par conséquent, l’Église jouait un rôle absolument déterminant dans la reproduction à long terme du système seigneurial — et l’on devrait certainement considérer que c’est ce qui a assuré sa position dominante au sein du système social (à moins de postuler quelque essentialisme à la piété des populations médiévales). En revanche, dès lors que la fluidité de la main d’œuvre devint un enjeu fondamental dans le cadre de la mise en place du salariat et d’un marché de main-d’œuvre nécessaires au capitalisme, la polarisation cléricale (l’esprit de clocher) et la domination cléricale corrélative sur les vivants comme sur les morts devinrent un problème — d’où la dispersion centrifuge des cimetières au 18e siècle, au-delà de l’argumentation du temps en termes d’hygiène de l’air (Guerreau 1996, p. 98)…
Mais alors à quoi bon les « communautés d’installés », puisque la paroisse semble assurer à elle seule la reproduction tendancielle du lien à la terre ? Je proposerais l’hypothèse suivante : le sens des « communautés d’installés » se trouve moins au niveau des villageois eux-mêmes et de leur volonté d’être ensemble (comme l’admettent les perspectives de la Genossenschaft ou du communalisme) qu’au niveau de leurs rapports aux seigneurs — et j’insiste ici sur le pluriel. Il convient en effet de considérer que la multiplicité des seigneurs qu’on peut observer dans les villages ou les villes n’est en rien la conséquence d’un enchevêtrement irrationnel des droits de propriété provoqué par des partages successoraux, ventes partielles, legs pieux, pertes militaires, etc., mais qu’elle constitue bien plutôt la structure du pouvoir seigneurial [63]. Sauf situation exceptionnelle (justement significative en tant que telle, tant par rapport à la règle que par les formes alors développées), chaque « communauté d’installés » se trouvait ainsi systématiquement face à un ensemble de seigneurs, aucune seigneurie ne constituait une cellule seigneuriale unique, si bien que la communauté des habitants ne pouvait remettre en cause la domination d’un seigneur sans menacer en même temps celle de plusieurs autres.
Le caractère infra-local du pouvoir de chaque seigneur — puisque chaque seigneur ne contrôlait qu’une partie de la communauté — avait comme corollaire le caractère multi-local du pouvoir seigneurial, chaque seigneur détenant des droits dans plusieurs lieux (Morsel 2004b, p. 175-178). Cette dispersion correspondait elle-même à un autre aspect clé, bien connu, de la transformation du système seigneurial médiéval, à savoir la réduction drastique des terres conservées en régie directe par les seigneurs (la réserve, dont l’exploitation directe n’était plus possible dans une situation d’extrême dispersion), et donc la nécessaire transformation des communautés en cadre d’organisation de la production (par opposition à la villa du système domanial). Non que les seigneurs se transformassent en rentiers du sol, par une sorte de quête de facilité, selon la classique « explication » psychologisante : ce désengagement — et plus généralement la dépersonnalisation du rapport seigneurial, qui se traduit par la réduction de la réserve tout comme par la régression du servage, et donc par l’organisation du travail au niveau de la communauté locale — était la condition sine qua non de la multi-localité du pouvoir seigneurial, elle-même corrélative, on l’a dit, de l’infra-localité, donc de la multiplicité locale des seigneurs, et donc finalement de la reproduction du pouvoir seigneurial.
Que la « communauté d’installés » devienne le cadre d’organisation du travail serait alors strictement corrélatif du fait qu’elle est en même temps un ensemble de seigneurs. La conversion des dépendants en habitants dont j’ai parlé antérieurement ne serait ainsi compréhensible qu’en tant que phénomène de dépersonnalisation symbolique des rapports de domination seigneuriale du haut Moyen Âge, qui assure la reproduction locale du pouvoir seigneurial. Si les populations ne cessent de bouger, elles le font désormais dans le cadre d’un réseau de lieux durables indépendamment de la présence des habitants, en sorte que les changements individuels ne remettent pas en cause le fonctionnement général, les déplacements individuels n’étant plus que des éléments d’une circulation (au sens propre) globale. Ce que cette société tendait désormais à reproduire, à l’échelle de l’Occident, c’étaient les rapports des agriculteurs au sol seigneurial (c’est-à-dire le moyen de production agricole approprié par les seigneurs), euphémisés par les rapports de chaque chrétien à un espace polarisé sur une église conçue comme « son » église.
Le test de la ville féodale.
Que le phénomène des communautés d’installés concernât l’ensemble de l’Occident ne doit cependant pas être conçu de manière seulement géographique (l’ensemble des régions d’Occident, sauf exception nécessairement signifiante), mais aussi sociale : il n’est pas censé s’agir non plus d’un phénomène purement rural. Il convient par conséquent de tester sur le cas urbain les hypothèses explicatives élaborées précédemment à propos des campagnes — ce qui est cependant loin d’être la chose aisée que la richesse de la documentation urbaine pourrait faire accroire, ne serait-ce que parce que l’urbain médiéval n’est pas si facile à définir qu’on pourrait l’imaginer, sauf à se contenter de nos évidences. C’est bien ce que suggère, parmi d’autres, Gudrun Wittek lorsqu’elle observe : « Qu’est-ce qu’une ville ? Qu’est-ce qui fait une ville ? C’est une question souvent posée, à laquelle on ne répond cependant jamais de façon complètement satisfaisante. La ville ne s’est jusqu’à présent pas laissée définir indépendamment du temps et de l’espace (zeit- und raumübergreifend) » (Wittek 1994, p. 165). Malheureusement, au lieu d’en tirer la conclusion qu’il ne faut sans doute pas considérer la ville comme zeit- und raumübergreifend, donc au lieu d’historiciser la notion, l’auteur de ces remarques tente de parvenir au plus petit dénominateur commun, ce qui aboutit à un résultat assez peu efficace : « une concentration plus ou moins grande d’hommes » (ibid.), bref une simple agglomération [64]. C’est pourquoi l’on ne peut qu’accepter le refus d’André Joris de considérer « la ville », dotée d’une « définition idéale… applicable en tous temps et en tous lieux » (1969, p. 96 et 100), comme un objet de recherche adéquat, auquel il oppose le « phénomène urbain » dont il préconise « une approche globale » (ibid., p. 100) — à condition toutefois que le syntagme « phénomène urbain » fasse lui-même l’objet d’une construction notionnelle, sans quoi l’on risque simplement de déplacer le problème sans le régler [65].
Ainsi, de même qu’il convient d’historiciser « le village », au-delà de l’image d’intemporalité sinon d’éternité dont joue la communication politique, marchande ou religieuse actuelle, il n’échappera à personne que, même si le mot lui-même est utilisé d’un siècle à l’autre, « la ville » n’est pas non plus une notion intemporelle désignant une réalité dont seule changerait la forme, en fonction de la modernisation des techniques de construction ou de planification. Le rejet d’une telle posture essentialiste, focalisée sur le repérage de prétendues fonctions urbaines au détriment de la compréhension des pratiques historiques de l’espace, aboutit à une approche plus dynamique dont rend bien compte le concept de « fabrique urbaine » (Galinié 2000, Noizet 2007) : loin de se limiter aux seuls aspects matériels (histoire de la construction, urbanisme), ce syntagme renvoie à l’examen des interactions entre les hommes à propos de l’espace et donc entre les hommes et l’espace, à des échelles temporelles et causales nécessairement variables.
Revalorisant ainsi les changements face aux prétendues continuités, on pourrait même soutenir que « la ville » occidentale (c’est-à-dire ce que nous considérons comme « la ville ») est née/apparue [66] à partir de la fin du 11e siècle, malgré cette illusion de continuité qu’entretiennent l’existence d’agglomérations plus ou moins populeuses et actives au sortir du Bas-Empire, puis celle de civitates au haut Moyen Âge localisées au même endroit et absorbées par les villes des 12e-13e siècles, ainsi que l’usage durable du terme de civitas. Toutefois, une continuité topographique ne signifie rien en soi (les lycées, hôpitaux, casernes ou hôtels de ville installés dans d’anciens monastères ont-ils le même sens social que ceux-ci ?) et les civitates du haut Moyen Âge ne sont que des agglomérations, au caractère agraire souvent prononcé et dont la désignation comme civitas signale moins le caractère urbain que la présence d’un évêque. Il ne s’agit d’ailleurs le plus souvent que d’un noyau de peuplement parmi l’ensemble de ceux qui, plus tard, ont pu donner naissance à une ville [67]. Bref, les cités antiques ont fondamentalement disparu en même temps que le système social lié à l’Empire romain.
En revanche, les 12e-13e siècles sont le moment auquel commence à se mettre en place un ensemble de formes urbaines, par la fondation de villes ex nihilo ou la transformation d’agglomérations (anciennes ou nouvelles) en villes [68]. Le contexte à prendre en compte est celui de la formation des « communautés d’installés », dont la ville n’est qu’un cas particulier [69]. Rien ne permet en effet de considérer la ville comme prédisposée initialement à l’emporter sur l’ensemble des formes d’organisation humaine ni à s’opposer à la campagne dans le cadre d’un schéma binaire qui ne l’emporte sans doute vraiment qu’à partir du 18e siècle. Cet ensemble est pour l’essentiel en place à la fin du 13e siècle, qu’il s’agisse de la France, de l’Angleterre ou de l’Empire (à la fin du 14e siècle dans les régions de l’Est) [70], et il n’a pas connu de changements majeurs avant la Révolution industrielle (qui justement caractérise un tout autre système social).
Corollairement, on peut observer une profonde transformation du champ lexical urbain, que rien n’autorise à considérer comme insignifiant. Schématiquement, cette transformation est double. D’une part, alors que le latin christianisé a forgé et transmis aux langues vernaculaires une quantité colossale de termes, on assiste exactement à la situation inverse à propos des mots de « la ville » : les termes, couramment employés dans les textes latins [71], oppidum, urbs et civitas ainsi que leurs dérivés ont, pour les deux premiers, entièrement disparu des langues vernaculaires médiévales au profit de mots sans aucun rapport avec les termes latins (ville, town, stadt) articulés à d’autres termes tout autant nouveaux (ville/bourg/village, town/borough/village, stadt/markt/dorf). Urbs ne survit plus ainsi qu’à travers des termes savants et rares (et employés initialement moins pour l’espace urbain qu’au sens figuré) comme « urbanité » ou « urbain ». Quant à civitas, il devient certes le terme clé pour la désignation des villes de l’Europe latine méditerranéenne [72], mais au prix d’une profonde re-sémantisation, à savoir le lien avec la présence d’un évêque — ce qui explique aussi qu’ailleurs (et même pas dans l’Empire), il puisse désigner un quartier particulier au sein de la ville, celui de la cathédrale (cf. l’île de la Cité à Paris ou la City à Londres). Un tel bouleversement du champ lexical, qui plus est à rebours de la tendance dominante de latinisation du vocabulaire, ne peut être tenu pour insignifiant : il est le signe de ce qu’un profond changement social était à l’œuvre, mais il en a aussi été un facteur décisif.
Le second aspect de la transformation du champ lexical à propos de ce que nous appelons « ville » concerne les termes désormais mobilisés (hors de l’espace méditerranéen, je le rappelle) : non seulement ils ne sont pas d’origine latine, mais surtout ils sont d’origine rurale, comme le montre, en français, la présence du même étymon villa dans « village » et « ville » et, en anglais, le sens initialement rural de town. La dichotomie rural/urbain qui nous est si familière ne va donc pas de soi, et son usage à propos du Moyen Âge nous contraint à une gymnastique classificatoire qui se heurte en permanence à des formes hybrides (bourgs et bourgades, Flecken, quasi-cittá, etc.) et dont l’intérêt scientifique est finalement médiocre ; est-il vraiment important, par exemple, de rattacher telle bastide à la catégorie « ville », telle autre à la catégorie « village », en signalant alors que telle bastide rurale est une bastide qui a échoué… ? On perçoit ainsi combien une approche historique de la « ville féodale » contraint à modifier complètement notre système d’opposition et de groupement des objets, à faire courir la ligne de distinction non pas entre ville et village, mais par rapport à la cité antique et la ville industrielle [73].
Rien ne permet par conséquent de poser par principe que l’« installation », dans ses aspects de la résidence, de l’organisation de la production, de la polarisation sotériologique (c’est-à-dire des moyens de Salut) et de la confrontation à un groupe seigneurial, ne vaille pas également pour la ville. Pour ce qui est de ce dernier point, la multiplicité des seigneurs est une situation tout à fait courante et même systématique [74], et elle a pu se traduire (et donc s’entretenir) par l’estampillage des maisons (observé à Paris au moins à la fin du Moyen Âge — voir Roux 1995, p. 131-132 — sans qu’on sache depuis quand cette pratique avait cours), dont certaines pouvaient même être construites sur plusieurs censives distinctes mais voisines [75]. Le détenteur de la maison en question, relevant ainsi de plusieurs seigneurs en même temps, était alors dans une situation identique à celle, déjà signalée, d’un villageois tenant des terres de plusieurs seigneurs [76].
Pourtant, la question de la ville en tant que communauté d’installés doit être posée, dans la mesure où la ville n’apparaît à première vue ni comme une communauté de production ni comme une communauté de Salut — puisqu’elle est censée être caractérisée à la fois par la division du travail, et par une multiplicité des paroisses. Comment dès lors le paradigme de « l’installation » envisagé au village pourrait-il être possible ? Le cas urbain vient enrichir la réflexion, en même temps que ce mode de questionnement permet d’envisager autrement certains points de l’histoire urbaine. Afin d’éviter les situations biaisées liées aux incertitudes de notre distinction entre villes et campagnes, je m’appuierai essentiellement sur des travaux d’histoire urbaine concernant les « têtes de réseau urbain » de l’espace occidental non méditerranéen (France, Angleterre et Allemagne), à savoir Paris, Londres, Cologne et Lubeck [77].
La ville comme communauté productive.
On a vu qu’un caractère fondamental du système seigneurial est que désormais l’organisation productive s’accomplit au niveau du village, et qu’au village, l’appropriation collective du finage dans le cadre de l’organisation productive (y compris l’accès aux communaux) est ce qui permet d’articuler les feux en une « communauté d’installés ». Mais dans le cas de la ville, le rapport entre feu et communauté n’est pas aussi direct, car la « communauté d’installés » ne peut y former le cadre pratique de l’organisation de la production : l’une des principales caractéristiques de la ville est, Jacques Le Goff y a déjà insisté depuis longtemps, la division du travail (par exemple, 1957, p. 9) [78]. La ville a une dimension polyfonctionnelle qui constitue justement une grande différence par rapport aux agglomérations du haut Moyen Âge [79], mais aussi par rapport aux agglomérations slaves à la période étudiée [80] — sans parler bien sûr des villages, fondamentalement monofonctionnels (ce que ne remet absolument pas en cause la présence d’un ou deux « spécialistes » comme le forgeron ou le potier, ou encore le meunier, qui ont le plus souvent aussi des terres [81]).
En ville, la « communauté d’installés » n’est ainsi pas le cadre d’organisation des activités matérielles (agricoles, artisanales ou marchandes), ce qui pose alors le problème de l’articulation entre les feux (noyau de résidence et de production) et la communauté. Or c’est justement sans doute ainsi que l’on peut comprendre la mise en place d’une forme spécifique d’organisation, censée permettre d’articuler ensemble et à l’échelle de la communauté les feux « spécialisés » d’une même activité (ateliers ou ouvroirs, échoppes, peut-être aussi exploitations agricoles intra muros) : le « métier » ou la « guilde » (« hanse », zunft, fraternitas, mistery, etc.) [82].
La lutte contre la concurrence ou la recherche de la qualité, en général évoquées pour expliquer l’existence de ces « métiers » (reprenant ainsi parfois même des argumentations médiévales [83] — comme si celles-ci pouvaient correspondre à une perception objective du fonctionnement social, et comme si la lutte contre « l’envie » et « la convoitise » pouvait être considérée simplement sous un angle économique), passent ainsi à côté de l’efficacité structurelle propre du système des métiers, qui articule les divers ateliers en une structure de production « de la ville » : la bonne compréhension du sens social du « métier » est oblitérée par la négligence du segment « de/à/dans (telle ville) » qui accompagne systématiquement la mention de celui-là — on est tisserand de Bruges, fèvre-coutelier de Paris, boulanger de Pontoise, lormier de Londres, etc. On ne produit donc pas en son nom propre (à l’inverse du système actuel des « marques »), mais au nom de la ville (d’où l’équivalence fixe qui peut s’établir entre nom du produit et nom de la ville — d’où également l’existence de prix locaux, relevés par les manuels de marchands, et non pas de prix propres à tel producteur).
C’est ainsi moins sur le résultat de la normation (le processus de production, le produit) que sur le fait même de la normation qu’il faut se pencher : à titre d’exemple, les fameux bans échevinaux de Douai du 13e siècle (Espinas et Pirenne 1909) ne sont à réduire ni à une définition technique, ni à un contrôle patricien sur le monde des métiers, ni à des préoccupations antilibérales ou charitables ; ils sont avant tout indispensables à la reproduction de la « communauté d’installés » à partir de ses feux — et d’eux seulement, on le verra. Le système des métiers n’est ainsi pas un système « conservateur », comme on le soulignait fréquemment au 19e et au 20e siècle dans une perspective libérale hostile au corporatisme, mais un moyen de faire de la ville une « communauté d’installés » sans communauté d’activité effective. L’appartenance à un « métier » n’a ainsi rien à voir avec la définition de la profession (qui n’est grille de lecture — donc de configuration — de l’ordre social que dans notre société) ou un simple droit d’exercice — c’est en premier lieu un mode d’appartenance à la ville, en l’occurrence l’une des principales façons d’être « habitant » de la ville [84].
La place de l’organisation productive dans le fonctionnement urbain serait donc homologue de celle dans le fonctionnement villageois, et pour ce qui est du cas anglais, Rodney Hilton voyait dans l’organisation en métiers « une sorte de police municipale » permettant aux « gouvernements municipaux » de contrôler « l’économie industrielle » au même titre (mais plus efficacement) que « le faisaient les propriétaires terriens pour l’économie rurale » (Hilton 1990, p. 25) [85]. Toutefois, si la dimension du contrôle dans l’organisation des « métiers » ne fait aucun doute, il est clair qu’il est réducteur de s’arrêter là : cette organisation a un effet structurant essentiel au niveau de la communauté d’installés, car elle permet justement à la ville d’être une communauté d’installés.
Consécutivement, l’appartenance au système des métiers constitue un enjeu de l’appartenance à la communauté urbaine : ceux dont on ne veut pas ou qui ne veulent pas appartenir à la « communauté d’installés » sont exclus du monde des métiers ; ceux qui veulent (ou sont censés) appartenir mais « à part » (en général « au-dessus ») sont organisés de manière homologique (c’est-à-dire à l’échelle de la « communauté d’installés »), mais de manière formellement (par les divers modes de représentation) distincte. Le cas parisien est significatif à cet égard : on y observe d’une part l’exclusion des artisans juifs du système des « métiers », ce qui est en général expliqué par le fait que les « métiers » sont nécessairement chrétiens puisqu’ils sont souvent doublés d’une confrérie. Il ne s’agit là cependant que d’une explication superficielle (surtout si on laisse de côté l’observation triviale que, dans la société chrétienne, tous les non-juifs sont nécessairement chrétiens, ce qui ne ferait pas du « métier » une forme spécifiquement chrétienne, mais uniquement par extension ou dérivation), ces deux aspects (« métier » et « confrérie ») n’étant corrélés entre eux que par l’intermédiaire d’un troisième aspect, qui est justement l’existence nécessaire d’une articulation entre feux ou personnes et « communauté d’installés », articulation devant être assurée charnellement et spirituellement [86]. On sait par ailleurs qu’il pouvait exister des formes alternatives d’organisation des métiers, correspondant à l’existence de seigneurs concurrents : il existait par exemple des « métiers » de l’évêque [87] ou encore de l’abbaye de Sainte-Geneviève [88], dont l’affirmation face aux autres « métiers » parisiens peut justement être considérée comme une forme de résistance seigneuriale à la formation de la « communauté d’installés » [89].
D’autre part, on observe à Paris des cas significatifs de « mise à part » de certains types de « métiers », dont l’expression la plus significative est leur absence du Livre des métiers du prévôt du roi Étienne Boileau (v. 1268), qu’on ne peut en aucun cas réduire à une énumération descriptive : comme toute entreprise de formalisation écrite, il s’agit de construire un être social particulier, ici le monde des métiers [90], c’est-à-dire un mode spécifique d’appartenance à la ville. On retiendra essentiellement trois formes d’absence : en premier lieu le cas des « marchands de l’eau », organisés précocement (dès le règne de Louis VI ?) au niveau parisien [91], mais qui ne se considèrent en aucun cas comme un simple « métier » — ils constituent tout simplement le « patriciat » parisien, qui contrôle le fonctionnement « municipal » de la ville (Bove 2004), c’est-à-dire qu’ils tentent prioritairement de mobiliser la ville au service de leurs intérêts (largement convergents avec ceux de l’ensemble de l’aristocratie locale, à laquelle ils sont étroitement liés dès le 12e siècle [92], voir Bournazel 1975, p. 59 et p. 69-90). Un autre type d’absence est celui du « métier » des bouchers, organisés également précocement [93] : ils détiennent collectivement des privilèges et occupent un espace clairement défini (au contraire des autres métiers), mais sont traditionnellement à part dans la société et l’imaginaire social [94] — non seulement à Paris, mais aussi dans beaucoup de villes.
Le troisième type d’absence est celui des universitaires : il a déjà été observé que l’université était structurée de manière analogue à un « métier » urbain, la hiérarchie écolier-bachelier-maître étant strictement parallèle à celle d’apprenti-valet-maître des « métiers » (Verger 1973, p. 65) [95]. On sait par ailleurs que l’articulation entre l’université et la « communauté d’installés » a été délicate, le diplôme accordé en 1200 par Philippe Auguste ayant apparemment abouti à une sorte de juxtaposition (Morsel 2000b, p. 373-374) [96], ce qui pourrait sembler faire aller de soi l’absence des universitaires dans le Livre des métiers : quelle n’est pas alors la surprise de trouver, à la fin du préambule, le début d’un article concernant les écoliers, probablement jamais écrit [97], qui montre combien l’assimilation à un « métier » pouvait constituer un enjeu de première importance du point de vue du positionnement en ville.
On observera cependant qu’en dépit de ces formes d’organisation parallèle, qui pourraient sembler faire de la ville une juxtaposition hétérogène de groupes, tout ceci converge en fait dans le même sens : car chacune de ces formes (l’ensemble des métiers enregistrés par Boileau, la hanse des marchands de l’eau, la boucherie, l’université) se présente comme étant « de Paris ». Ainsi, au-delà des écarts (qui relèvent de stratégies de pouvoir au sein de la communauté), c’est toujours la « communauté d’installés » qui est promue — et l’on peut même considérer qu’elle se renforce à proportion des revendications et oppositions entre métiers et formes analogues dès lors que le qualificatif « de Paris » n’est justement pas remis en cause mais tacitement admis, sur le mode de l’évidence : elle gagne alors à chaque fois un supplément d’existence, en tant que dimension « naturelle ».
Ceci n’est toutefois effectif que pour autant que chacune de ces formes ne corresponde pas à un sous-ensemble spatial particulier : si l’organisation en « métiers » (et/ou hanses, guildes, etc.) avait abouti à un fractionnement de l’espace urbain (sachant qu’il y avait très largement identité entre lieu d’habitation et de production), on pourrait plus difficilement considérer cette organisation en « métiers » comme un fondement de l’existence de la « communauté d’installés » dans son ensemble. Or, précisément, les travaux de socio-topographie urbaine ont montré la très large inexistence d’un tel zoning professionnel dans la ville médiévale, même lorsqu’on peut observer la localisation concentrée de certaines activités en raison d’impératifs techniques (besoin d’eau ou nuisances induites). Johannes Cramer (1984) a ainsi démontré, principalement pour l’Empire (mais avec quelques incursions en France), la fragilité méthodologique des affirmations d’une existence de prétendus « quartiers » professionnels (relevé des noms de rue ou de quartiers, repérages ponctuels et isolés des feux) : nulle part ne se laisse observer avec certitude l’existence de tels quartiers, y compris dans le cas du « métier » peut-être le plus problématique, celui de la tannerie (qui cumule les facteurs de rejet, liés au travail de produits liés à la mort, aux terribles odeurs induites par le procédé technique et au besoin d’eau, polluée après son usage).
L’examen détaillé du cas des tanneries dans l’Empire par le même auteur (Cramer 1981) montre que si l’on peut observer une tendance à la concentration des tanneries dans certains endroits de la ville (à la périphérie ou dans certaines rues, le long de ruisseaux ou du cours d’eau majeur), la formation d’un « quartier » réservé aux tanneurs n’est observable que dans quelques villes (notamment Ulm, Colmar, Strasbourg, Nördlingen, Leipzig, Görlitz), mais apparemment pas avant l’extrême fin du Moyen Âge [98]. À ce moment-là d’ailleurs, on peut observer en certains endroits une dissociation entre le lieu de production et le lieu d’habitation des tanneurs, ce qui fait donc cesser aux tanneries d’être des « feux » à proprement parler (et les tanneurs sont de fait recensés à leur lieu d’habitation, considéré comme leur « feu », voisin de divers « non-tanneurs »), selon un procédé que l’on peut repérer également là où se produit une certaine concentration des activités de boucherie [99].
Dans le cas de Paris, les rôles de taille des dernières années du 13e et du début du 14e siècle permettent d’observer que, s’il existe parfois une certaine concentration locale d’activités particulières (parfois imposée par le pouvoir à des fins de contrôle, comme pour le change installé sur le Grand Pont — avec là encore une dissociation du lieu d’exercice et du lieu de résidence), il ne s’agit jamais d’une concentration exclusive : d’autres membres du « métier » se rencontrent ailleurs dans la ville et des membres d’autres « métiers » sont actifs à l’endroit considéré. Quant aux noms de rues formés sur des métiers particuliers, ils ne correspondent que de manière épisodique aux activités qu’on y rencontre. Ceci ne signifie évidemment pas qu’il existe une relative homogénéité sociale de la ville : les registres de taille permettent clairement d’observer les inégalités de niveau de taxation (donc de fortune) d’une paroisse à l’autre. Mais une telle inégalité de la distribution spatiale, sans doute implicitement connue des habitants, n’était pas cristallisée et « dramatisée » par une distribution spatiale stricte des métiers (Cazelles 1972, p. 90-91) [100].
La même chose peut être observée à Cologne en 1286 (quoique pour la seule paroisse St-Kolumba — toutefois la plus importante de la ville) : les activités artisanales y apparaissent très largement mélangées. Tout au plus peut-on parfois observer côte à côte deux artisans exerçant la même activité, sans que cela exclue la présence d’autres artisans de même activité dans d’autres rues, ni des artisans ayant d’autres spécialités dans cette même rue (Herborn 1975). La même chose peut être dite pour un quartier de Lubeck (l’un des secteurs centraux au bord de la Trave) suivi entre 1284 et 1348 (Falk et Hammel 1987), ainsi que pour 17 métiers de Greifswald entre 1350 et 1450 (Igel 2005, notamment p. 232-236 et 244 — plan malheureusement peu lisible) [101], ou encore pour les « métiers » liés à un usage de l’eau à Bruxelles — alors que, justement, l’emplacement des ateliers était soumis à une contrainte qui aurait pu se solder par une concentration qu’on n’observe guère (Deligne 2003).
Cette dispersion fondamentale des « feux » relevant d’un même métier (même si cette dispersion n’est pas complètement aléatoire et même si des noms de rues peuvent donner l’impression de regroupements professionnels) apparaît ainsi comme un complément essentiel de l’efficacité du système des « métiers » dans la configuration de la « communauté d’installés ». En effet, non seulement ce système permet de faire de chaque artisan (ou commerçant) spécialisé un habitant de la ville, mais en outre la large dispersion des ateliers et échoppes vient éviter que ce système des « métiers » ne débouche sur une juxtaposition de macrocellules productives. Cette mixtion « professionnelle » et de l’habitat garantissait ainsi une bonne intégration sociale, à la fois du point de vue des représentations (sentiment d’appartenance collective à la ville indépendamment des différences d’activité), mais peut-être aussi du point de vue de la cohésion concrète [102].
On ne peut ainsi en aucun cas réduire le système des « métiers » à une simple institution politico-économique (témoignant au passage du caractère archaïque et sous-développé de la société médiévale) ni non plus à un simple conservatoire/laboratoire d’un fonctionnement communautaire d’origine carolingienne, passé par analogie ou imitation dans la commune urbaine : ce système a joué un rôle essentiel et actif (c’est-à-dire pas seulement référentiel) dans la sociogenèse des « communautés d’installés » urbaines.
La ville comme communauté de Salut.
L’identification directe d’une ville comme communauté de Salut, analogue à ce qu’est la paroisse pour le village, n’est pas plus aisée que comme une communauté de production. En effet, beaucoup de villes comprennent plusieurs paroisses, moins pour des raisons d’encadrement d’une population nombreuse que de l’origine polynucléaire des villes — l’accroissement démographique ayant pu ensuite aboutir à la subdivision d’anciennes paroisses ou à la création ex nihilo de nouvelles paroisses dans les interstices ou à la périphérie. Avec ses quelque 110 paroisses au début du 13e siècle (Brooke et Keir 1975, p. 122-131, Holt et Rosser 1990, p. 13, Hilton 1990, p. 27) [103], Londres est la championne absolue en la matière, bien qu’elle soit loin d’égaler l’importance démographique de Paris, qui n’a alors qu’une trentaine de paroisses (Friedman 1959, Cazelles 1972, p. 18, et surtout Bourlet et Bethe 2013, p. 162) pour plus de 200 000 habitants vers 1320 (contre ca. 80 000 à Londres). À la même époque, Cologne avait 19 paroisses pour une population d’environ 35 000 habitants. Ces trois exemples illustrent parfaitement le fait bien connu qu’il n’y a aucun rapport entre le nombre des paroisses et le nombre d’habitants [104] — la logique sociale est ailleurs. On rencontre d’ailleurs des villes notables qui n’ont qu’une seule paroisse, comme Francfort/Main ou Besançon [105], mais en ce cas, les établissements ecclésiastiques réguliers (abbayes de chanoines réguliers et surtout, à partir du 13e siècle, couvents mendiants) servent clairement de relais pour la pratique « normale », en dehors des grands « rites de passage » de la vie des laïcs (baptême, communion pascale, éventuellement mariage), mais aussi souvent pour l’inhumation. Il faut ainsi non seulement tenir compte des églises paroissiales, mais aussi de l’ensemble des établissements ecclésiastiques (absents de l’espace villageois, sauf parfois un monastère ou un prieuré — mais qui n’ont aucune fonction pastorale du fait de leur règle de clôture) pour tenter de comprendre comment on pouvait passer de cette multiplicité (ce que Jacques Chiffoleau appelle le « polycentrisme religieux », 2001) à une conception de l’appartenance à une communauté de Salut, sachant que le modèle de base (réactivé par le concile de Latran IV) reste le Salut individuel.
La question se pose d’autant plus que certaines paroisses urbaines pouvaient servir de base à l’organisation « profane » de la « communauté d’installés », soit parce qu’elles correspondaient précisément à des ressorts seigneuriaux, comme à Paris (Friedman 1959), soit parce qu’elles ont servi de base à la définition de « quartiers » (quarterius, quartale, carton, quartier, viertel, ort, quarter ainsi que des termes qui renvoient à des divisions en plus de quatre parties : sestier, sizain, etc.) [106], c’est-à-dire des subdivisions institutionnelles de l’espace urbain dans le cadre desquelles sont censées être assurées certaines fonctions particulières, notamment en matière fiscale et défensive, parfois aussi électorale. Bref, si l’on devait absolument les comparer à des formes urbaines actuelles, ce serait plutôt une sorte d’« arrondissement » [107].
Ainsi à Cologne, la ville est organisée en de tels « quartiers », au nombre de 19, dénommés Kirchspiele et qui sont largement coextensifs avec les paroisses — comme le sous-entend d’ailleurs le mot Kirchspiel (que je traduirais littéralement par « ressort ecclésial ») ainsi que le vocable de la plupart d’entre eux, sans parler du droit de présentation du curé que beaucoup ont obtenu au 13e siècle (Erkens 1998, p. 178-181). Ceci conduit notamment à des formes d’assimilation de la paroisse avec le Kirchspiel. C’est ainsi que la rédaction des coutumes du Kirchspiel de Niederich (au nord de la ville intra-muros) vers 1150 s’intitule traditiones et leges… in parrochia Nitherich [108], alors que ce Kirchspiel ne correspond pas à une seule paroisse (voir Illustration 2), ou encore que les sceaux utilisés dans ce cadre hésitent entre la dimension paroissiale et la dimension « civile » [109]. Mais si l’on peut (et doit) ainsi considérer que la paroisse urbaine jouait un rôle identique à celui de la paroisse rurale dans l’intégration collective des chrétiens, au point d’aboutir à la formation de petites « communautés d’installés » dès lors que l’organisation paroissiale était redoublée par la structuration seigneuriale (comme à Paris) ou une organisation municipale (comme à Cologne), et si l’on admet que la sociogenèse des « communautés d’installés » devait être indissolublement spirituelle et corporelle, alors il faut tenter de comprendre comment cette situation d’hétérogénéité paroissiale a été dépassée.
On pourrait songer, à la suite de Jacques Chiffoleau (2000), à la pratique des fondations de messes anniversaires par un même habitant dans divers établissements ecclésiastiques de la ville. Mais outre que cette pratique est mal connue dans le détail de ses réalisations pour la période considérée [110], il est difficile de la lire comme un mode d’appartenance à une communauté spirituelle parisienne : l’inscription sur l’obituaire intègre au mieux à la communauté des chrétiens commémorés dans l’église en question, les messes sont fondées pour le salut de l’âme du fondateur, parfois aussi de ses proches et éventuellement pour tous les chrétiens, guère pour les seuls Parisiens ni au profit du culte divin local (par la fondation d’objets et « infrastructures » liturgiques, comme on pourra l’observer à Nuremberg dans la seconde moitié du 15e siècle, voir Staub 1995 [111]). Il faut par conséquent trouver d’autres modes d’intégration collective des individus chrétiens, susceptibles d’articuler l’inévitable appartenance paroissiale et l’appartenance à la ville en tant que communauté de Salut — une sorte de super-paroisse, en somme.
L’un d’eux pourrait être celui des processions urbaines générales, au-delà du seul cadre paroissial. Les Rogations, puis aussi (à partir de la fin du 13e siècle) la Fête-Dieu sont les principales processions régulières à travers toute la ville (per civitatem ou per villam [112]), à quoi pouvaient s’ajouter des processions générales exceptionnelles pour conjurer un danger (Chiffoleau 1990, Signori 1995, p. 247-269) ou célébrer un événement important (par exemple, une bataille, voir Graf 1991, 2003). L’examen qui a été fait récemment de la pratique des Rogations à la fin du Moyen Âge (Kuchenbuch, Morsel et Scheler 2010, p. 167-179) montre d’une part qu’elles étaient organisées par le clergé lui-même (dont il exprimait le caractère médiateur incontournable entre les hommes et dieu), d’autre part que leur mention et, possiblement, leur pratique présente un caractère fondamentalement urbain (sinon limité aux cités épiscopales), enfin qu’il s’agissait avant tout d’un rite « trans-ecclésial » (en ce sens qu’il consistait systématiquement à articuler plusieurs églises locales entre elles) organisé, dans les cités, à partir du pôle principal qu’était la cathédrale. Les Rogations avaient ainsi pour effet d’établir une spatialité cléricale, trans-paroissiale, en ville, sous la forme d’une « mise en réseau » des différentes églises — un réseau à la fois hiérarchisé (par le départ et le retour, trois jours de suite, de et à la cathédrale) et s’étendant, de manière rayonnante, jusqu’à la périphérie (voire, lorsque c’est possible, à l’une des hauteurs périphériques surplombant la ville — ce qui nous rappelle que la maîtrise de l’espace passe aussi par celle du relief).
On pourrait, en revanche, considérer que le succès de la Fête-Dieu pour la question qui nous occupe présente un double intérêt : d’une part, à la différence des Rogations, centrées sur les reliques, la Fête-Dieu est centrée sur l’hostie (d’où le nom courant de procession du Corpus Christi), c’est-à-dire une espèce strictement monopolisée par le clergé (alors que n’importe qui peut avoir chez soi des reliques, ce qui relativise d’autant leur puissance de focalisation sur les églises — sauf à y multiplier les reliques de saints prestigieux, avec tous les risques que cela représentait en matière de trafic, bien mis en scène par Chaucer dans ses Contes de Canterbury) et réalisée par le clergé lors de la consécration eucharistique. D’autre part, le corpus Christi présente une dimension « communautaire » nettement plus affirmée que les Rogations en raison de la théologie de la communion qui fait de la consécration eucharistique à la fois l’effectuation du corps du Christ et du « corps mystique » qu’est l’ensemble des chrétiens (Lubac 1944). Toutefois, on ne perdra pas de vue que le corpus Christi (qu’il s’agisse de l’hostie ou de la procession, dans les deux cas effectuées localement) n’est pas censé fonder une communauté locale, mais intégrer à l’ensemble de l’Église — ce qui signifie qu’on ne peut pas exclure que l’instauration et le développement de la Fête-Dieu doivent être considérées comme une forme de réaction (sur le mode de l’intégration à une échelle beaucoup plus vaste contre le développement des communautés d’installés, conçu comme une modalité de division (charnelle)).
Outre cette intégration annuelle des paroissiens en un ensemble chrétien proprement urbain, il me semble qu’on doit également prendre en compte une autre forme de dépassement de l’appartenance étroitement paroissiale : les confréries. On connaît malheureusement assez mal les confréries des 12e-13e siècles dès lors qu’il ne s’agit pas de confréries de clercs (comme celle du Mans, voir Vincent 1993) ou spécifiquement « accrochées » à un établissement ecclésiastique (comme la confrérie des « fèvres » de Caen « domiciliée » dans une abbaye pré-montrée extérieure à la ville et qui fait bénéficier les confrères du trésor des suffrages de l’ensemble de l’ordre prémontré, voir De Boüard 1957). Toutefois, le cas de Cologne a bénéficié, ces dernières années, d’un important travail de publication de documents [113] qui permet un certain nombre d’observations. Hermann Jakobs (1985) a déjà clairement souligné le lien étroit qui existe entre la constitution de formes confraternelles (guildes, métiers, confréries), qu’il subsume sous le nom de Bruderschaft (à traduire ici par « confraternité » et correspondant au terme latin fraternitas dont usent alors les textes), et la formation de la « commune » de Cologne (soulèvement de 1074, contrôle des murailles en 1106, coniuratio pro libertate en 1112, etc.). Sa démarche est toutefois essentiellement institutionnelle et consiste à faire apparaître les points de recoupement (personnels, spatiaux ou institutionnels) entre les diverses formes confraternelles, pour expliquer comment se forme et s’impose le pouvoir communal (au profit d’une élite elle-même organisée confraternellement, dans le cadre de la Richerzeche – le « club des puissants »). Mais ceci ne permet pas, me semble-t-il, de comprendre comment l’hétérogénéité fondamentale de la ville (à Cologne au moins autant qu’ailleurs) a pu être dépassée au profit d’un espace social urbain. Il importe pour cela d’intégrer à l’analyse la dimension proprement spatiale (tant dans l’espace concret que dans les représentations spatiales) des « confraternités ».
L’ambiguïté (pour nous) du terme fraternitas ne doit évidemment pas être considérée comme un signe d’imprécision sémantique (implicitement corrélé à un sous-développement social ou culturel) : c’est là uniquement le signe de ce que notre mode de distinction entre « métier » et « confrérie » (sous-tendu par notre distinction courante entre économie et religion) n’avait pas cours dans cette société. De fait, le cadre du « métier » est l’un des plus anciens cadres d’apparition et de développement des confréries de laïcs (voir le cas susmentionné des « fèvres » de Caen), avant que s’en soient détachées et organisées parallèlement (sur le modèle des confréries de clercs ?) des confréries de « métier », en parallèle aux « métiers » eux-mêmes. Les « métiers » conservent ensuite souvent, de cette situation antérieure, quelques traits caritatifs (la caisse de secours), mais les confréries de « métier » ne se préoccupent normalement pas du tout des aspects productifs et techniques du « métier », ce qui a aussi pour corollaire qu’elles ne recrutent pas seulement parmi les membres du « métier » concerné. Mais dans la mesure où les membres du « métier » en question y sont dominants et où, comme on l’a vu antérieurement, ces membres du « métier » sont généralement dispersés à travers l’espace urbain, on peut en conclure logiquement, même en l’absence de listes de membres, que les confréries de « métier » assemblaient sans doute des personnes appartenant à des paroisses différentes.
On peut probablement en dire autant de la « Grande confrérie Notre-Dame aux prêtres et bourgeois de Paris », dont la plus ancienne mention sûre remonte à 1203 (Le Roux de Lincy 1844, Vaquier 1911) [114], qui assemblait des membres résidant dans diverses paroisses (ce que confirme également l’obituaire de la confrérie, dans lequel est fréquemment mentionnée l’église paroissiale également chargée de la commémoration, voir Bove 2000, p. 259, note 21). Le cas de la confrérie Saint-Wolfgang de Ratisbonne présente des traits particuliers, mais qui, en définitive, rendent sa fonction sociale comparable : sa plus ancienne mention sûre remonte à 1201, mais elle est expressément organisée en huit « branches » (appelées elles aussi fraternitates) localisées chacune dans un des établissements ecclésiastiques séculiers ou réguliers qui, par ailleurs, constituent les pôles paroissiaux. Par conséquent, la confrérie dans son ensemble recrutait à la fois au niveau paroissial et à l’échelle de la ville, et la possibilité existait, en tout cas à la fin du Moyen Âge et moyennant finance, de mobiliser lors de ses obsèques les huit « branches », représentées par leurs cierges [115].
Dès lors, toutefois que l’on n’a pas affaire à une confrérie dont le recrutement est catégoriel (ou alors relative à une catégorie dont on ignore la distribution spatiale), ou pour laquelle on ne dispose pas de listes de membres, la mesure de son caractère communautaire à l’échelle urbaine devient délicate. C’est là que le cas colonais peut nous aider. Huit confréries « de laïcs » y ont jusqu’à présent été repérées avant 1300 [116], mais la documentation les concernant est plutôt maigre. Quatre ne sont connues que par une unique mention, une seulement présente une liste de membres (composée pour l’essentiel de prénoms…), une autre un nécrologe et une liste de donateurs (dont « l’adresse » à Cologne est difficile à trouver…). Il est par conséquent particulièrement malaisé de mesurer l’échelle de dispersion de ces confréries.
Toutefois, on dispose pour trois d’entre elles d’indications concernant des maisons de Cologne qui sont en leur possession ou qui leur sont explicitement données, et l’on peut raisonnablement penser que la concentration ou la dispersion spatiales de celles-ci pourraient être considérées comme l’indice du rayonnement de la confrérie en question [117]. Par ailleurs, l’existence à Cologne de l’extraordinaire documentation des Schreinsbücher, qui enregistrent depuis le 12e siècle une bonne partie des mutations immobilières, qu’elles localisent à peu près précisément et dont Hermann Keussen (1910) a recoupé les localisations, permet de cartographier ces possessions (voir Illustration 2) [118].
Pour la confrérie du Saint-Esprit, fondée en relation avec l’hôpital du Saint-Esprit (directement auprès de la cathédrale), on dispose de près d’une trentaine de telles localisations jusqu’à la fin du 13e siècle (Militzer 1997-99, n° 42.1-42.34, p. 654-669) : elles se répartissent un peu partout dans l’espace colonais [119], notamment dans neuf à dix paroisses [120]. La confrérie des Rois Mages, également liée (mais cette fois directement) à la cathédrale, est moins bien documentée : on ne connaît qu’une quinzaine de transactions (dont plus de la moitié — et les plus anciennes — sont mentionnées par un seul document et ne figurent pas dans les Schreinsbücher) pour la seconde moitié du 13e siècle (Militzer 1997-99, n° 26.1-26.8, p. 306-310). Elles se répartissent sur toute la moitié nord de la ville [121], en particulier sur cinq paroisses [122] ; il s’agit probablement d’un minimum étant donné la forme de la documentation. Cette incertitude est encore plus grande pour la confrérie Sainte-Croix, liée à la collégiale St. Maria ad Gradus (toujours à proximité immédiate de la cathédrale), pour laquelle on ne connaît que quatre possessions entre 1292 et 1300 (Militzer 1997-99, n° 86.1-86.5, p. 1030-1031) : elles se répartissent sur le centre (Herzogstraße, Breite Straße : paroisse St. Kolumba) et le nord (Maria-Ablaß-Platz : paroisse St. Maria Ablaß) [123]. En dépit du caractère inégal et certainement incomplet de la documentation actuellement disponible, il ne fait aucun doute que les trois confréries envisagées étaient connues à travers l’essentiel de l’espace colonais. Ceci ne signifie bien sûr pas que les donateurs de maisons ou de cens sur les maisons étaient automatiquement des membres de la confrérie considérée, mais du moins qu’ils s’en « sentaient » d’une manière ou d’une autre proches. Que par ailleurs les trois confréries examinées aient toutes trois gravité, directement ou indirectement, autour de la cathédrale est très probablement significatif : on retrouve ici la fonction focalisante (homologique à celle de l’église paroissiale dans la communauté villageoise) de la cathédrale qu’on avait déjà rencontrée à propos des Rogations.
Tout ceci ne signifie évidemment pas que toutes les confréries jouaient un tel rôle de « pont » entre les paroisses [124] : certaines pouvaient sans doute se restreindre à une rue ou aux environs immédiats d’un établissement ecclésiastique. Mais entre les confréries de « métier » et les confréries focalisées sur les cathédrales (sans oublier celles qui sont organisées autour des couvents mendiants, sur lesquelles on n’a que peu d’informations pour l’époque), il me semble qu’on peut considérer sans difficulté, comme je l’ai fait antérieurement du « métier », qu’il s’agit là d’un mode d’appartenance (chrétienne) à la ville. Une illustration spectaculaire de ceci est fournie par le cas de Digne en 1291 (Coulet 1993, p. 354), où la consultation des habitants au sujet d’une levée de taille est réalisée, sur l’initiative des cominaux (l’embryon de municipalité) eux-mêmes, par l’intermédiaire de trois confréries, couvrant l’ensemble de l’espace urbain (ville et bourgs extra-muros). Au-delà de l’appartenance paroissiale, la confrérie faisait appartenir à ce que les discours urbains du temps présentaient de plus en plus comme une « sainte ville », éventuellement une préfiguration de la Jérusalem céleste, en tout cas comme une « société chrétienne urbaine ». La prise en compte de ce phénomène est indispensable à la compréhension de la sociogenèse de la ville médiévale (et au dépassement des positions anti-urbaines exprimées par un certain nombre de clercs, principalement bénédictins), qui ne peut en aucun cas être réduite simplement à des facteurs politico-institutionnels. Encore une fois, la ville est un ensemble de rapports sociaux formant système, et la formation de cet ensemble de rapports sociaux ne peut être qu’indissolublement matériel et idéel.
On pourrait ainsi considérer que c’est par le biais des « métiers » et des « confréries » que les gens vivant en ville deviennent des « habitants » de la ville au sens fort du terme et par opposition à de simples résidents — bref ce que j’ai appelé des « installés ». L’efficace en la matière de processions comme les Rogations, puis plus tard de la Fête-Dieu, ne semble pas non plus pouvoir être négligée. Tout ceci montre combien la distinction ville/campagne vient brouiller l’analyse du phénomène communautaire et qu’il importe de la dépasser au profit d’une approche plus globale, en l’occurrence centrée sur l’appartenance sociale collective référée à un lieu. Ce qu’il s’agit de comprendre, au-delà des cas particuliers et des fausses distinctions, c’est comment tiennent ensemble un nombre croissant de personnes agglomérées, ou (pour pasticher Alain Desrosières) comment on fait « de l’un à partir du multiple » (1993, p. 87), sans que cet « un » soit un simple agrégat mais bien plutôt une « réalité sociale » spécifique à laquelle croit l’ensemble des acteurs sociaux. Le problème majeur qu’a rencontré (et réglé) cette société était de faire tenir un ensemble très hétérogène qui ne disposait d’aucune légitimité en soi : le rassemblement des hommes au niveau villageois devait être produit, et a fortiori la coalescence de plusieurs noyaux de peuplement et de plusieurs paroisses au niveau urbain.
Au-delà cependant de ce qui retient le plus l’attention, à savoir le processus d’agglomération, souvent corrélé à une lecture politique en termes d’union qui fait la force, il faut observer que ce processus d’« installation » produit avant tout de la fixation au sol, à la campagne comme à la ville. Mais, on l’a dit, cette fixation est une « fixation douce », « euphémisée » (pour reprendre une terminologie de Pierre Bourdieu), en ce sens d’une part qu’elle n’apparaît pas comme une contrainte mais comme un désir de la part des populations (l’« esprit de clocher », l’« heureux qui comme Ulysse… »), d’autre part qu’elle n’assure pas une immobilisation de la population, mais bien plutôt une présence partout — la valorisation de la figure du retour étant le complément indispensable de cette mobilité tolérée parce qu’encadrée [125]. Dans le cas artisanal, la disponibilité de la main-d’œuvre était assurée par la circulation non seulement intense, mais surtout systémique des valets (compagnons), tandis qu’être maître signifiait, comme le disent les statuts des lormiers londoniens, « maison tenir » [126].
Par conséquent, l’idée d’une conversion des dépendants en « installés » ne devrait en aucun cas faire accroire que les villageois ou les citadins ne sont plus des dominés : c’est tout simplement la forme de la domination qui a changé, sans qu’on puisse considérer qu’il y a eu atténuation effective. L’hypothèse qui se dessine ici est même plutôt celle d’une meilleure efficacité de la domination, grâce à la participation décisive quoique involontaire des « installés » à leur propre soumission, par le biais de l’internalisation d’un système de représentations dans lequel l’appartenance spatiale à la fois masque les rapports interpersonnels de domination et légitime la soumission de chacun à des impératifs collectifs. Le modèle théorique à l’arrière-plan est celui de la « violence symbolique », développé en son temps par Pierre Bourdieu (1980, p. 216-221) [127], mais jusqu’alors plutôt négligé par les historiens. La « communauté d’installés » devrait par conséquent être conçue comme un mode d’encadrement social plus intense (que je qualifie de « densification sociale »), dans lequel les dominés se chargent involontairement de l’essentiel du travail à travers la naturalisation du référent local de leur vie. La bonne question serait par conséquent non pas : dis-moi où (ou comment) tu habites et je te dirais qui tu es, mais : dis-moi si tu habites — et je te dirais ce que tu es.
Illustration : Vue du village de Gemmingen (Allemagne) au début du 16e siècle (dessin conservé au Generallandesarchiv Karlsruhe). Source : Wikipedia.