




C’est en 2016 que Perrier Jablonski a embauché sa première ethnographe. Sabrina Tremblay, d’abord venue observer « L’émergence d’une nouvelle organisation créative » chez nous (le nom de son mémoire de maîtrise) pour HEC. Mais Sabrina avait été envoyée chez nous par Jean-Sébastien Marcoux, le plus grand anthropologue de la consommation au Québec. Il allait devenir (sans le savoir), le parrain influent et bienveillant de notre jeune firme.
Une expérience si bouleversante pour nous qu’elle allait changer le cours de notre jeune histoire, et réorganiser le travail en équipes-trios : ethnographe, stratège, chargée de projets. C’est encore le modèle que nous utilisons aujourd’hui.
Pour chaque projet, on sélectionnait un groupe de participants, on menait des entrevues d’une heure, puis on transcrivait à la main. Pour une heure d’entrevue, il fallait compter une heure et demie de transcription. Donc… 2h30 par entrevue. C’était cher et laborieux, mais la qualité des observations que nous faisions comblait largement l’investissement.
Il fallait cependant avouer qu’au fil des projets qui grandissaient, ce temps de traitement devenait colossal. À l’époque, nous avions cherché des outils commerciaux de transcription. Les plus fiables — les mêmes utilisés par les tribunaux — coûtaient des milliers de dollars par licence. Hors de portée pour notre usage. Puis est arrivé… Whisper.
En septembre 2022, OpenAI publie Whisper — un modèle de transcription automatique entraîné sur 680 000 heures d’audio multilingue. Open source, sous licence MIT : gratuit, modifiable, installable localement sur n’importe quel ordinateur. Quiconque voulait transcrire un fichier audio sans l’envoyer dans le cloud, pouvait le faire gratuitement.
Pour Perrier Jablonski, ç’a été un basculement. Les heures passées à transcrire mécaniquement ont pu être réparties dans ce qui compte vraiment : plus d’entrevues, plus d’analyse, plus de livrables. L’ethnographie que nous pratiquions de façon presque artisanale s'est largement professionalisée… Et nos projets se sont multipliés. Le plus beau? Cette automatisation a permis à Perrier Jablonski de démocratiser l’anthropologie. Elle est devenue accessible à des organisations qui n’en n’auraient jamais eu les moyens auparavant. Les PME, les OBNL, les équipes à petit budget pouvaient enfin s’offrir du vrai terrain, de vraies observations, de vrais insights.
Une vraie révolution, je vous dis ! Mais...
Pendant plus de trois ans, nous avons utilisé le modèle Whisper via l’application MacWhisper. Un bon outil. Fiable, local, économique, rapide. Mais au fil des projets, ses limites sont devenues évidentes pour notre usage.
D’abord, la précision dans le temps. MacWhisper place les mots dans des blocs de quelques secondes. Pour lire une transcription, c’est suffisant. Pour analyser une entrevue précisément, il faut savoir où chaque mot commence et finit… à la milliseconde.
Ensuite, il ne sait pas qui parle. Deux voix pendant 45 minutes produisent un seul bloc de texte. La diarisation — séparer les voix — est arrivée en bêta fin 2025, tard et encore imparfaite. Dans une entrevue qualitative, savoir qui dit quoi est la condition minimale.
Enfin, les voix séparées restent étiquetées « Speaker 1 / Speaker 2 ». Des numéros anonymes. Pour une firme qui conduit des centaines d’entrevues par année, avec les mêmes ethnographes, renommer à la main chaque fichier est un travail que la machine devrait faire seule.
Ça, c’est sans parler des bugs importants qui nous forçaient à repasser à travers chaque entrevue méticuleusement. Nous avions besoin d’un meilleur outil, alors nous l’avons construit.
La première version de Boris était donc un outil de transcription. Nous sommes partis d’un modèle plus récent que Whisper, WhisperX, développé par l’équipe Visual Geometry Group d’Oxford (Bain et al., 2023), dont nous avons utilisé les nouvelles fonctionnalités à fond, avant de lui adjoindre des fonctionnalités-maison.
D’abord, la diarisation : séparer les voix avant même de transcrire. Un modèle analyse le signal pour repérer qui parle quand, en comparant les empreintes acoustiques au fil de l’enregistrement — sans comprendre les mots. Résultat : un bloc de texte par personne, au lieu d’un monologue mélangé.
Ensuite, l’alignement forcé. Whisper transcrit par phrases de quelques secondes ; Boris ajoute une deuxième passe qui recale chaque mot à la milliseconde exacte d’apparition dans l’audio. On peut alors retrouver, dans le signal brut, le moment précis où un mot a été prononcé — et tout ce qui l’entoure : intonation, pause, hésitation.
Enfin, l’identification nominative. Les voix des ethnographes de Perrier Jablonski sont stockées une fois dans l’application. À chaque nouvelle entrevue, Boris reconnaît leur empreinte et les étiquette par leur nom réel — puis filtre leurs interventions, parce que ce qui nous intéresse, c’est les propos du participant, pas ceux de l’intervieweur.
Et toutes ces opérations sont effectuées en local, sur nos Mac, sans jamais se promener sur le réseau — pour une confidentialité absolue. Si on devait le commercialiser, Boris battrait déjà tous les outils du commerce :
Nous n’allions pas nous arrêter en si bon chemin. En développant la transcription de Boris, nous avons réalisé qu’on pouvait synchroniser chaque mot avec le signal audio brut. Cela ouvrait deux portes : analyser ce que les gens disent avec une précision inédite, et analyser comment ils le disent — c’est-à-dire leur voix elle-même.
Nous avions construit le meilleur moteur de transcription disponible sur le marché… Mais venions d’ouvrir la voie à un tout nouveau type d’analyse…
Quand on termine 20 entrevues sur le même sujet, on a besoin d’un outil visuel pour illustrer ce que les participants nous ont dit. Un outil que vous connaissez bien : le nuage de mots. Les mots les plus fréquents apparaissent en gros, les plus rares en petit. En un regard, on voit le territoire lexical du groupe. Mais pour qu’un nuage de mots soit lisible — et utile — il faut toujours faire un peu de ménage.

Le premier geste, c’est d’écarter les mots qui n’apportent rien : « de », « que », « est », « avoir », « chose ». Les linguistes les appellent des stopwords — des mots vides. Ils sont partout, ils noient tout. Les retirer, c’est déjà voir plus clair.
Le deuxième geste, c’est la lemmatisation : ramener chaque mot à sa racine. « Méritaient », « méritera », « méritent », « mériterait » deviennent tous « mériter ». Sans ça, chaque variante compte pour un mot distinct et le signal s’éparpille. Après ce nettoyage, une entrevue de 45 minutes qui contenait 3 800 mots bruts en contient environ 1 700 analysables. Sur un projet de 20 entrevues, on passe de 76 000 à 34 000.
Le nuage de mots obtenu est un portrait lexical du groupe : ce qui habite leurs pensées, ce qui revient dans leurs bouches, ce qui tient le terrain mental.
Mais un nuage seul ne dit pas tout. Les mots qui reviennent le plus souvent sont souvent les plus attendus — « mission », « culture », « équipe » dans un mandat organisationnel. Pour aller plus loin, il fallait chercher ailleurs : d’abord identifier le champ lexical vraiment spécifique à chaque participant, et ensuite… les mots qu’on aurait attendus mais qu’on n’a pas entendus…
Analyser les mots à ce niveau de précision est totalement inédit. Pour un client, c’est comme passer du 720P au 8K d’un seul coup. Cerise sur le sundae, à ce stade de l’analyse, aucune donnée n’a quitté nos machines, tout se fait 100 % en local, tout 100 % confidentiel.
Pendant une entrevue, la voix d’un participant transporte bien plus que des mots. Elle accélère quand un sujet devient sensible. Elle baisse d’un ton quand la confiance s’installe. Elle tremble imperceptiblement quand une émotion remonte. Admettons que ces signaux soient identifiables, peut-on réellement les interpréter?
L’étude de ces signaux s’appelle la prosodie. Jusqu’ici, elle appartenait à d’autres mondes : les phonéticiens qui décrivent les langues, les cliniciens qui diagnostiquent la dépression par le timbre de la voix, les ingénieurs qui entraînent des assistants vocaux. En 2023, Van Rijn et Larrouy-Maestri ont publié dans Nature Human Behaviour une analyse portant sur plus de 3 000 minutes d’enregistrements issus de corpus mondiaux. Leur conclusion : sept facteurs acoustiques — qualité vocale, intensité, hauteur, rythme, fluctuations rapides et aléatoires (shimmer), variation du pitch et spectre fréquentiel — expliquent à eux seuls 57 % de la variance émotionnelle dans la voix humaine. Sept facteurs mesurables? Parfait! C’était notre nouveau brief!
C’est la deuxième révolution proposée par Boris. L’application échantillonne chacun de ces signaux toutes les 500 millisecondes, en continu, sur toute la durée de l’entrevue. Le résultat : 7 signaux mesurés toutes les 0.5 secondes, pendant 45 minutes — plus de 37 800 points de données signaux potentiels par entrevue. Une véritable mine d’informations !
Chaque mesure est comparée à la ligne de base propre au locuteur — ses propres moyennes de débit, d’intensité, de hauteur. Boris ne confond pas quelqu’un qui parle naturellement fort avec quelqu’un qui s’emballe en parlant fort tout à coup. Un signal n’est pertinent que s’il est inhabituel pour cette personne en particulier.
Un raclement de gorge avant de répondre à une question sur la direction ? Un chuchotement au moment où le participant mentionne un collègue ? Un soupir presque inaudible quand l’ethnographe aborde le sujet de la gouvernance ? Ces événements, qui ne sont ni des mots, ni de la prosodie… Mais sont aussi des données précieuses pour un ethnographe.
Alors nous avons implémenté la détection de 18 types d’événements paralinguistiques : plusieurs niveaux de rire, les soupirs, les sanglots, les applaudissements, les exclamations, les chuchotements — c’est un système semblable à celui d’Apple, qui détecte les sons environnants pour les personnes malentendantes (réglages > accessibilité). Nous avons simplement utilisé le modèle de Google YAMNet, entraîné sur plus de 2 millions de clips audio. Il contient 521 classes sonores, mais nous n’avons choisi que les 18 qui étaient pertinentes pour Boris.
Chaque événement est horodaté, scoré, filtré et intégré à l’analyse comme signal à part entière.
Cette analyse ultra fine se fait au même rythme que l’analyse prosodique, toutes les 500 millisecondes.

La mémoire de travail humaine traite entre 5 et 9 éléments à la fois — psychologie cognitive (Miller, 1956). Un ethnographe qui conduit une entrevue, doit maintenir le lien avec le participant, formuler des hypothèses, réorienter ses questions ou son enquête, prendre des notes… il a déjà beaucoup de travail et il ne peut pas traiter 139 000 signaux. Maintenant… il peut.
En d’autres termes, Boris analyse 25 types d’événements (7 signaux prosodiques et 18 sons) deux fois par seconde. Ces 139 000 points de données par entrevue représentent plus de 2 700 000 mesures traitées, comparées entre elles, et interprétées pour un projet de 20 entrevues chez Perrier Jablonski.
Souvenons-nous que dans le passé (hum… il y a 3 ans), un ethnographe avait besoin de 1h30 pour transcrire 1h d’entrevue. Non seulement, ce temps est désormais réduit à néant, mais en plus, il offre une précision d’analyse totalement inédite dans notre milieu.
Chez Perrier Jablonski, nous avons toujours séparé les observations ethnographiques et les observations éditoriales, faites par le stratège. L’un écoute et analyse. L’autre propose des pistes réflexions, identifie des tensions à dénouer, formule… L’un est un radiologue qui scanne, l’autre est un médecin de famille qui interprète.
Mais avec Boris, nous avons inventé une troisième voie. Un nouveau genre d’observations que nous avons appelées synthétiques, qui consiste en une analyse croisée des couches sémantiques, prosodiques et sonores.
Ces croisements permettent des observations impossibles jusque-là, qui s’ajoutent aux précédentes :
L’arc émotionnel. Boris agrège les signaux prosodiques et les événements sonores par fenêtres de deux minutes, et trace la courbe d’intensité de la conversation. L’ethnographe voit d’un coup d’œil où l’entrevue a basculé. En superposant les 20 courbes d’un projet, on voit si un même moment du guide fait réagir tout le monde.
Les contradictions internes. Boris repère les moments où un participant dit une chose en début d’entrevue et son contraire en fin. Il met les deux énoncés côte à côte, avec leur signature prosodique, et on identifie quel énoncé porte la charge émotionnelle la plus forte (travaux de Festinger sur la dissonance cognitive, 1957).
Le non-répondu. Boris croise le guide d’entrevue avec les verbatims pour repérer les questions esquivées, contournées, ou restées sans réponse. Une matrice montre, d’un coup d’œil, quelles questions ont été évitées par quels participants. La prosodie autour du moment d’esquive — silence, raclement de gorge, accélération du débit — enrichit le diagnostic.
Les verbatims marquants. Boris sélectionne les 15 à 20 citations les plus puissantes du corpus en combinant trois critères : la richesse sémantique du segment, l’intensité prosodique par rapport à la baseline du participant, et la présence d’un événement sonore. Les citations sortent prêtes pour une présentation client, avec leur contexte et leur score.
Le miroir linguistique. Boris mesure si un participant commence à utiliser les mots de l’ethnographe au fil de l’entrevue — un indicateur classique d’accommodation linguistique (Niederhoffer et Pennebaker, 2002). Il trace la convergence lexicale dans le temps et signale les entrevues où le participant semble s’aligner sur le langage de l’intervieweur plutôt que de parler avec ses propres mots. C’est un outil d’auto-critique : l’ethnographe voit son propre effet sur le participant et peut disqualifier une entrevue (mais ce n’est jamais arrivé encore).
Si Boris mesure tout, il ne signale pas tout. Cela représenterait un volume d’information délirant, contreproductif pour l’équipe. Alors il filtre. Seuls les signaux qui dépassent un seuil de significativité — une variation suffisamment inhabituelle pour ne pas être attribuable au hasard — sont retenus et présentés à l’ethnographe.
Une observation synthétique est une observation que seule la machine peut détecter, mais que seul un humain peut interpréter. C’est le mariage parfait humain-machine.
Boris croise les données prosodiques, sémantiques et paralinguistiques de chaque participant pour le positionner sur une matrice comportementale. Les axes de cette matrice naissent d’une conversation entre l’ethnographe et la machine.
Parfois, c’est l’ethnographe qui initie. Après avoir conduit les entrevues, après avoir senti le terrain, il formule une hypothèse : « Je crois que ce groupe se divise entre ceux qui résistent par loyauté et ceux qui résistent par épuisement. » Boris va chercher dans ses données les marqueurs qui correspondent, et positionne chaque participant.
Parfois, c’est Boris qui propose. À partir de l’ensemble des données qu’il a analysées — prosodie, sémantique, événements sonores — il formule une hypothèse sur les deux variables fondamentales qui structurent le groupe. L’ethnographe examine, ajuste, affine.
Dans les deux cas, le profil émerge de cette conversation — ni purement intuitif, ni purement algorithmique. L’ethnographe ressent. La machine détecte.

Pour la couche d’analyse en langage naturel, nous avons choisi Claude, d’Anthropic (après de nombreux tests). Mais un modèle de langage, aussi performant soit-il, reste généraliste. Livré à lui-même, il identifie admirablement, il organise parfaitement, il synthétise merveilleusement, il rédige efficacement… mais il ne pense ni comme un ethnographe, ni comme un stratège…
C’est pourquoi nous avons entraîné Boris sur notre propre corpus de connaissances. Plus de 200 articles et des centaines de références bibliographiques que Perrier Jablonski a accumulés au fil des dix dernières années sur les sujets qui préoccupent nos clients. Le modèle a appris comment nous formulions une observation, comment nous structurions une tension, comment nous nommions un paradoxe.
J’ai déjà insisté sur l’importance des corpus de connaissances des organisations. J’en parle dans mon deuxième bouquin (Les défis) publié en 2024, mais aussi dans l’article « Corpus, cursus, campus, caucus. Apprendre, fois quatre. »… Maintenant, vous comprenez pourquoi un corpus bien organisé a une valeur inestimable quand on se lance dans un projet technologique…
Pour poursuivre métaphore de la radiologie, Boris est un peu comme un IRM. Une machine d’une précision redoutable, capable de voir ce que l’œil nu ne voit pas. Mais un IRM ne pose pas de diagnostic. Il faut un radiologue pour lire les images, un médecin pour interpréter les résultats, et un patient qui a été orienté par les bonnes questions cliniques. Sans ça, l’IRM produit des images, mais pas des réponses.
C’est la même chose avec Boris. Si vous menez une entrevue sans méthode, que vous ne savez pas formuler une question ouverte, si vous orientez les réponses ou que vous ne savez pas créer un climat de confiance — Boris va quand même nous sortir une analyse. Il va produire des chiffres, des courbes, des observations. Mais elles ne vaudront rien.
C’est pourquoi nous avons décidé de ne pas commercialiser Boris, et de le garder pour nous… pour l’instant.
Il restait un dernier détail — et non des moindres — à régler. On l’a vu plus haut, la plupart des logiciels de transcription envoient vos fichiers audio sur des serveurs distants — c’est-à-dire sur internet, sur des ordinateurs qui appartiennent à d’autres entreprises, souvent aux États-Unis. Pour nous, impossible d’accepter une telle entorse à l’éthique et à la confidentialité qui nous chérissons tant chez Perrier Jablonski. Il fallait régler ça.
Avec Boris tout le traitement se fait directement sur notre ordinateur, dans nos bureaux… à une limite près : l’envoi des données à Claude. Nous avions besoin de contourner cet obstacle, alors nous avons inventé une méthode que nous avons appelé l’anonymisation de bout en bout.
Avant chaque envoi — sans exception — tous les noms de personnes, d’entreprises, de lieux, les montants et les coordonnées sont automatiquement remplacés par des codes incompréhensibles. Ainsi, tout ce qui est envoyé sur le réseau est crypté. Le modèle reçoit « P-x7k2m9 travaille chez O-m4r7x2 depuis T-w8k3 ans » au lieu de « Marie travaille chez Bombardier depuis 12 ans ». Claude analyse donc les bonnes situations, mais sans savoir de qui il s’agit. Quand il nous renvoie ses conclusions, notre moteur remplace les codes par les bonnes entités, et le tour est joué!
Aucun autre outil d’analyse qualitative sur le marché ne propose ce niveau de protection.
Grâce à Boris, des organisations qui n’avaient pas les moyens de financer une ethnographie complète peuvent maintenant y accéder. Boris traite une entrevue en deux fois moins de temps qu’elle n’a duré, avec une précision d’analyse totalement inédite. Des signaux faibles — ceux qui se cachent dans les silences, dans les tremblements, dans les mots qu’on ne prononce pas — deviennent visibles, mesurables, actionnables. Et pour nos clients, ça veut dire des projets plus ambitieux, plus accessibles, et des résultats d’une profondeur qui n’existait tout simplement pas avant.

On aurait pu se payer un trip techno, et faire de Boris notre joujou à nous — mais à chaque étape de sa conception nous nous sommes posé la question de l’utilité pour vous, pour nos clients.
Pendant une entrevue, un ethnographe écoute les mots. Mais il ne peut pas — physiquement — entendre les 139 000 signaux que contient une conversation de 45 minutes : les micro-variations de la voix, les soupirs à peine perceptibles, les accélérations de débit au moment précis où un sujet devient sensible. Boris, l'application développée par Perrier Jablonski, entend tout ça. Il transcrit chaque mot à la milliseconde, sépare et identifie les voix, analyse la prosodie sur sept paramètres continus, détecte 18 types de sons révélateurs, puis croise toutes ces couches pour produire des observations qu'aucun humain ne pourrait formuler seul — des contradictions inconscientes, des questions esquivées, des émotions qui contredisent le discours. Sur un projet de 20 entrevues, Boris croise près de 3 millions de mesures. Pour nos clients, ça change tout : des projets plus rapides, des corpus plus ambitieux (60, 80, 100 entrevues), des budgets plus accessibles, et surtout des recommandations stratégiques fondées sur une profondeur d'analyse qui n'existait pas avant Boris. Avec Boris, Perrier Jablonski concrétise son positionnement "Ethno, sapio, techno", mais surtout, propose une longueur d'avance à tous ses clients.
ARTICLE SCIENTIFIQUE · van Rijn, P. et Larrouy-Maestri, P. (2023). Modelling Individual and Cross-Cultural Variation in the Mapping of Emotions to Speech Prosody. Nature Human Behaviour, 7, 386–396. Étude menée au Max Planck Institute for Empirical Aesthetics (Francfort). À partir de modèles bayésiens appliqués à plus de 3 000 minutes d'enregistrements multilingues, les auteurs identifient sept facteurs acoustiques — qualité vocale (12 %), intensité (11 %), hauteur et formants (10 %), rythme et tempo (10 %), shimmer (6 %), variation du pitch (4 %) et MFCC 3 (4 %) — qui expliquent 57 % de la variance émotionnelle dans la prosodie. C'est l'étude qui a inspiré les sept signaux prosodiques de Boris.
ARTICLE SCIENTIFIQUE · Miller, G. A. (1956). The Magical Number Seven, Plus or Minus Two: Some Limits on Our Capacity for Processing Information. Psychological Review, 63(2), 81–97. L'un des articles les plus cités de l'histoire de la psychologie. Miller démontre que la mémoire de travail humaine ne peut traiter simultanément qu'entre 5 et 9 éléments d'information — la raison pour laquelle un ethnographe ne peut pas, seul, traiter les 139 000 signaux que Boris génère par entrevue.
OUVRAGE · Festinger, L. (1957). A Theory of Cognitive Dissonance. Stanford University Press. Cadre théorique fondateur de la dissonance cognitive : la tension psychologique créée par des croyances ou des énoncés contradictoires. Boris l'applique en repérant les moments où un participant dit une chose en début d'entrevue et son contraire à la fin, puis en comparant la charge prosodique des deux énoncés.
ARTICLE SCIENTIFIQUE · Niederhoffer, K. G. et Pennebaker, J. W. (2002). Linguistic Style Matching in Social Interaction. Journal of Language and Social Psychology, 21(4), 337–360. Trois expériences — dont l'analyse des transcriptions du Watergate — démontrent que les interlocuteurs coordonnent inconsciemment leur usage des mots au fil d'une conversation. Les auteurs proposent une hypothèse de coordination-engagement plutôt que de rapport. Boris utilise cette mesure pour détecter la convergence lexicale : quand un participant adopte progressivement le vocabulaire de l'ethnographe, cela peut signaler une forme d'accommodation plutôt qu'une expression authentique.
ARTICLE SCIENTIFIQUE · Bain, M., Huh, J., Han, T. et Zisserman, A. (2023). WhisperX: Time-Accurate Speech Transcription of Long-Form Audio. Interspeech 2023. Développé par le Visual Geometry Group de l'Université d'Oxford, WhisperX ajoute à Whisper un alignement forcé au mot et une diarisation par empreinte vocale. C'est le moteur de transcription sur lequel Boris est construit.
MODÈLE · Gemmeke, J. F., Ellis, D. P. W., Freedman, D., Jansen, A., Lawrence, W., Moore, R. C., Plakal, M. et Ritter, M. (2017). Audio Set: An Ontology and Human-Labeled Dataset for Audio Events. IEEE ICASSP, 776–780. Le jeu de données de référence en classification audio : plus de 2 millions de clips de 10 secondes, 521 classes sonores, étiquetés par des humains. YAMNet (Yet Another Mobile Network), le modèle de Google entraîné sur AudioSet, est utilisé par Boris pour la détection des 18 classes d'événements paralinguistiques.
OUVRAGE · Brinkmann, S. et Kvale, S. (2015). InterViews: Learning the Craft of Qualitative Research Interviewing (3e éd.). Sage. L'ouvrage de référence mondiale en méthodologie d'entrevue qualitative. Brinkmann et Kvale y documentent les dynamiques de l'entrevue semi-structurée, les biais de l'intervieweur, et les stratégies d'évitement thématique — le cadre méthodologique dans lequel Boris opère.
NOTE DE CALCUL · Chiffres Boris (entrevue de 45 min). 7 signaux prosodiques + 18 classes d'événements sonores = 25 mesures échantillonnées toutes les 0,5 seconde sur 2 700 secondes = 5 400 fenêtres × 25 = 135 000 points par entrevue. Sur 20 entrevues : ≈ 2 700 000 mesures croisées et interprétées.
Nous sommes au début des années 50, l’armée de l’air américaine veut améliorer les performances en vol de ses escadrons. Les mensurations des pilotes ayant changé au fil des années, le temps de repenser le cockpit des appareils est venu. La mission est confiée à la Base de Wright Air Force. 4000 pilotes sont mesurés dans tous les sens, avec un objectif simple : créer le cockpit parfait, le cockpit de tous les cockpits, le cockpit qui conviendrait à tous les pilotes... autrement dit, le cockpit moyen.
Après donc un demi-million de mesures, le cockpit idéal est testé sur les 4000 pilotes. Savez-vous combien de pilotes sont rentrés parfaitement dans ce cockpit? 50, 20, 10, 5? La réponse est devenue une révélation pour tous les innovateurs du monde : zéro. zéro virgule zéro. Aucun pilote! Zéro!!!
Cette incroyable étude menée par les militaires et les scientifiques ne souffrait d'aucune contestation possible, et la morale de l’histoire est simple : la moyenne n'existe pas. C'est à Todd Rose que nous devons cette démonstration étonnante dans une conférence TED, The Myth of Average.
L'usager normal est peu enclin à nommer certains problèmes ou dysfonctionnements. La raison? On s'arrange avec! Regardez le nombre d'objets, de produits ou de services imparfaits autour de nous! On s'adapte, on s'organise, on vit avec. Alors si vous interrogez la moyenne, la probabilité qu'elle ait de grandes révélations à vous faire est faible. Si on me demande s'il est difficile de me servir d'une balayeuse, il se pourrait bien que je le prenne mal... Quand même! Une balayeuse! Mais si on m'observe pendant le ménage, qu'on voit que je galère avec le fil, que je fais la grimace quand le tuyau est coincé dans le coin d'un meuble, qu'on note que je dois la monter du garage, puis la redescendre, en la faisant frotter contre les murs... Tous ces "besoins" sont dits "latents" : ils sont invisibles, et même pas dignes de mention. Alors que les besoins manifestes sont beaucoup plus faciles à obtenir : je veux une balayeuse légère, avec un bon prix et un bon look. Je peux nommer des besoins manifestes universels... mais totalement inintéressants. Ils n'ont pas — ou peu — de valeur. Au final, je me suis offert un robot aspirateur. Pourquoi? Parce que je n'ai pas à le déplacer, parce qu'il n'y a ni fil ni tuyau. J'ai rempli mes besoins latents avec un produit qui n'a pas tenté de simplement remplir des besoins évidents, manifestes.
Imaginer un produit pour la moyenne des consommateurs, c'est imaginer un produit pour... personne. Alors à qui faut-il penser? Aux usagers extrêmes. Ces utilisateurs extrêmes sont étudiés à la loupe par celles et ceux qui veulent surprendre le marché, car ils sont plus bavards que les utilisateurs moyens. Ils ont des choses à vous dire et voici qui ils sont.
Ils ne sont pas encore vos clients. Ils ne le seront jamais si vous n’inventez rien pour eux. Les non-utilisateurs peuvent fournir des informations sur les raisons pour lesquelles ils ne sont pas des utilisateurs actuels d'un produit ou d'un service. Cela peut inclure des obstacles tels que le coût, la complexité ou le manque de conscience de l'existence du produit ou du service. Ils peuvent également fournir des informations sur les besoins non satisfaits, des préférences qui ne sont pas prises en compte par les produits ou services existants. Ces informations sont précieuses pour diversifier un marché, explorer un segment de marché sous-estimé ou "mal traité".
Voici un exemple connu, celui de McDonald’s qui a tenté de mieux comprendre les végétariens qui fuyaient la marque. Résultat : aujourd'hui, McDonald’s a ajouté des formules végétariennes à son menu avec un grand succès.

Ce sont des utilisateurs un peu incompétents avec votre produit. Malhabiles. Débutants. Ils sont moins forts que la moyenne, mais beaaaaaucoup plus bavards. Ils n'ont pas de honte à nommer ceci ou identifier cela. Parfois un handicap peut les empêcher d'utiliser un produit ou un service, ils vont être alors plus enclins à faire des demandes précises. Il peut d'agir aussi d'incompétence pure : "je ne connais rien à la course à pied, mais j'aimerais m'y mettre". On peut aussi penser aux débutants "je viens d'arriver dans l'entreprise et je ne connais pas les outils à utiliser", etc. Dans tous les cas, leur ego n'est pas mis en jeu lors d'une entrevue. Ils n'ont pas à savoir d'emblée. Alors ils sont libres de nommer les choses telles quelles sont. Cette candeur est très très précieuse.
Un exemple connu : c’est grâce à des personnes âgées atteintes d’arthrite que les designers industriels de Smart Design ont conçu une gamme d’ustensiles de cuisine... utilisés par tout le monde — pour leur client OXO Good Grip. Le cas est d'ailleurs bien documenté ici.

Ils sont plus forts que la moyenne. Ce sont des utilisateurs experts, fidèles. Ils ont des choses à vous dire pour améliorer votre produit. Il peut s'agir d'un chauffeur qui fait plus de 50 000 km par année, et qui peut vous parler de fatigue au volant. Une employée fidèle depuis 15 ans a certainement des choses intéressantes à vous dire sur la culture de l'entreprise. On parle ici des pros, des athlètes de votre produit ou de votre service.
Exemple connu : le détaillant de sport Décathlon effectue de nombreuses recherches avec utilisateurs expérimentés dans tous les sports pour améliorer ses produits. Leur page "innovation" est d'ailleurs très explicite à ce sujet!

Ce sont ces usagers qui se sont débrouillés sans vous, avant vous. Ils sont bricoleurs, curieux, avant-gardistes, savants, et surtout... Ils ont DÉJÀ trouvé la solution... Je me souviens de l'exemple partagé par Louis Garneau. Lors d'une compétition, il s'aperçoit qu'un cycliste avait lacéré ses souliers de vélo pour les aérer et les rendre plus souples. C’est ainsi qu'il a amélioré son modèle en créant une mise à jour... plus aérée et plus souple.

Voilà celles et ceux qu’il faut observer, questionner, comprendre. Ils vous mettront sur la piste de solutions nouvelles et vous permettront d'inventer de nouveaux produits ou services. L'intérêt pour les usagers extrêmes réside dans leur capacité à révéler des problèmes et des opportunités qui pourraient passer inaperçus lorsqu'on se concentre uniquement sur les utilisateurs moyens. Les solutions développées pour répondre aux besoins de ces usagers extrêmes ont souvent le potentiel d'améliorer l'expérience de l'ensemble des utilisateurs. Et c'est ça la beauté de l'exercice! Les usagers extrêmes nomment des besoins latents au nom de la masse. Ils deviennent des porte-parole de l'insight qu'un usage moyen n'aurait jamais osé, jamais pensé, jamais pris la peine de partager avec vous. Chez Perrier Jablonski, c'est un point de départ obligatoire avant tout travail stratégique. Nous cherchons les usagers extrêmes qui pourraient nous mettre sur les bonnes pistes.
Attention : cela n’est pas une garantie de succès commercial... C'est une piste à explorer! Mais si la solution est unique, elle vous donnera un avantage certain face au marché. Dernier exemple pour la route, Yoplait, et ses contenants de 1 litre. Typiquement, la forme de peanut est beaucoup plus facile à agripper... et c'est vrai pour tout le monde. Mais c'est en parlant à des personnes âgées atteintes d'arthrite qu'ils l'ont appris...

L'ethnographie a ses racines dans la discipline anthropologique, où elle a longtemps été utilisée pour comprendre les cultures humaines. Son utilisation dans le marketing du 21e siècle est moins marquée, les marques étant parfois désireuses d'obtenir des résultats rapides et ne voyant pas le retour sur l’investissement (ROI). L’ethnographie implique beaucoup de détails et certains spécialistes du marketing pourraient être découragés.
Mais, nous sommes là pour vous guider !
Dans cette série, nous vous proposons des méthodes d’ethnographie simples et puissantes qui produisent un retour sur l’investissement important dans les organisations.
Les professionnels tels que les avocats, les journalistes et les médecins apprennent à poser des questions dans le cadre de leur formation. Le Harvard Business Review nous apprend que peu d’acteurs en marketing considèrent le questionnement comme une compétence qui peut être perfectionnée. C’est une occasion manquée…
Pourquoi ne pas poser plus de questions ?
Pensez plus loin !
Comme votre client fait partie d’un contexte beaucoup plus grand que lui, la première étape est de poser des questions, pas juste au client lui-même, mais à vos concurrents et à vos collègues.
Méthodes pour être un expert dans le questionnement :
Au départ, soyez conscient de 2 choses :
Où faire l’entrevue : allez à un endroit où votre interlocuteur est à l’aise et où il vous sera possible d’observer des éléments externes à l’entrevue.
Vous vous dites que vous déplacer est coûteux en temps et en argent ? Bonne nouvelle, les outils de vidéoconférence sont nombreux et simples d’utilisation, et des études démontrent que des entrevues en ligne sont positives, car elles diminueraient le stress de l’interlocuteur (Eg. Kumar 2020; Fine & Abramson 2020; Rahm-Skâgeby 2011).
Mon conseil : ayez constamment un visuel sur votre interlocuteur, vous pourrez lire son langage corporel et vous observerez des choses au-delà des propos de celui-ci.
Un guide d’entrevues, oui ! mais...
En acceptant une entrevue, une personne a des choses à vous dire alors, laissez-la vous guider par ses propos ; vous serez surpris des choses dites que vous n’auriez jamais pensé à discuter avec elle. Bref, ne tombez pas dans le piège de trop suivre votre guide comme un enquêteur.
Vous ne parlez pas à la même personne au début et à la fin de l’entrevue. Vous devez donc rendre votre interlocuteur à l’aise. Pour créer une évolution « naturelle » de la confiance mutuelle entre vous et l’interlocuteur, suivez une logique de questions.
Débutez en posant des questions larges et simples - comme des questions d’expérience, d’opinion, de sentiment. Et finissez par des questions plus précises et qui requièrent de la réflexion - comme des questions de connaissance.
Posez des questions ouvertes et non fermées : personne n'aime se sentir mis sur la sellette- et certains types de questions peuvent forcer les répondants à répondre par oui ou par non, sans espace pour la nuance. Les questions ouvertes peuvent contrecarrer cet effet et peuvent donc être particulièrement utiles pour découvrir des informations ou apprendre quelque chose de nouveau.
Posez des questions naïves.
Remettez tout en question.
C’est ce qu’Albert Einstein a déclaré. Posez des questions que vous pensez déjà connaître. En fait, testez vos connaissances !
Les silences sont importants et soyez un bon auditeur. Déjà, en 1936, Dale Carnegie dans son classique How to Win Friends and Influence People, argumentait que les silences seraient bien vus, car ils démontreraient une bonne qualité d'écoute.
Avez-vous déjà entendu le mot « objectivité » ? Le fait de ne jamais juger et de rester 100% indépendant de vos pensées ?
Et bien, laissez-moi vous confier un secret d’ethnographe : cela n’existe pas. Nous pouvons avoir des degrés d’objectivité différents, mais l’objectivité complète n’est pas possible. Alors, soyez conscient de vos propres jugements avant, durant et après l’entrevue.
Nous sommes au début des années 1990. Le Japon domine le monde industriel. Toyota, Honda, Sony — les entreprises nippones enchaînent les succès et les Américains cherchent à comprendre pourquoi. L'une des réponses se trouve dans un processus que les Japonais utilisent depuis 1972, le Quality Function Deployment (QFD) — un système qui consiste, en gros, à intégrer la voix du client dans chaque étape du développement d'un produit. De la conception à la fabrication.
Le problème, c'est que personne ne s'est jamais vraiment demandé comment capter cette fameuse voix. Combien de gens faut-il écouter? Comment structurer ce qu'ils nous disent? Et surtout : à quel moment peut-on considérer qu'on en sait assez pour agir?
C'est exactement la question qu'Abbie Griffin et John R. Hauser se sont posée. Griffin est alors à l'Université de Chicago. Hauser est au MIT, au Sloan School of Management. Ensemble, ils vont produire un article de 27 pages qui va devenir la référence absolue en recherche sur les besoins des clients : The Voice of the Customer.
Leur terrain d'étude? Un objet d'une banalité désarmante : les glacières. Plus précisément, les dispositifs portables pour transporter et conserver de la nourriture — glacières, paniers à pique-nique, sacs isothermes, sacs à dos. Un objet que tout le monde connaît, que tout le monde utilise, et dont personne ne pense avoir grand-chose à dire. C'est justement ce qui rend l'expérience fascinante.
Griffin et Hauser ont interviewé 30 clients potentiels. Chaque entrevue a été retranscrite et analysée par sept analystes indépendants. Au total, les chercheurs ont identifié 220 besoins distincts. Deux cent vingt. Pour traîner sa nourriture.
Et c'est là que ça devient intéressant. En une seule entrevue, un interviewer captait environ 20 % de tous les besoins. Après quatre entrevues : plus ou moins 50 %. La courbe montait rapidement, puis commençait à s'aplatir. Après 20 entrevues, les chercheurs avaient identifié ~90 % de l'ensemble des besoins du segment de 30 personnes étudié.
Autrement dit : quelques dizaines de conversations bien menées suffisent pour comprendre la quasi-totalité de ce qu'un public attend. Pas mille. Pas cinq cents. Vingt.
Il faut mesurer ce que cette découverte implique. En 1993 — et encore aujourd'hui —, la plupart des organisations pensent qu'il faut des centaines, voire des milliers de répondants pour « valider » quoi que ce soit. C'est la tyrannie du quantitatif. On envoie des sondages à 10 000 personnes, on compile les résultats dans des tableaux croisés dynamiques, et on appelle ça de la rigueur.
Griffin et Hauser ont démontré l'inverse. Pour identifier les besoins — c'est-à-dire comprendre ce que les gens veulent vraiment —, le qualitatif est redoutablement plus efficace que le quantitatif. L'entrevue individuelle, menée en profondeur par un interviewer attentif, fait émerger des besoins que les sondages ne captent tout simplement pas.
Griffin et Hauser poussent l’analyse plus loin en comparant deux approches classiques de recherche qualitative : les entrevues individuelles et les focus groups. Cette fois-ci, ils décident de mesurer, concrètement, quelle méthode permet d’identifier le plus de besoins uniques par moment investi. Leur terrain d’étude : des utilisateurs d’équipements informatiques. Leur équipe a recueilli les besoins des clients à partir de huit focus groups de deux heures et de neuf entrevues individuelles d’une heure. Cela a permis de créer une liste combinée de 230 besoins clients.
Le constat est clair. À temps équivalent, les entrevues individuelles sont plus performantes. Deux entrevues d’une heure permettent déjà d’identifier autant de besoins qu’un focus group (51 % vs 50 %). Mais c’est à partir de quatre entrevues que l’écart devient significatif : quatre heures d’entrevues révèlent plus de besoins qu’un volume équivalent de focus groups (72 % vs 67 %). Et au-delà de la performance, la logistique est aussi plus efficace: il est beaucoup plus simple et moins coûteux de mener quelques entrevues en vision conférence que de mobiliser des groupes de sept ou huit personnes pendant plusieurs heures.
Bref, Griffin et Hauser démontrent qu’à effort égal, chaque heure investie en entrevue génère davantage de valeur — et le graphique suivant en apporte une preuve claire.

Revenons maintenant à nos glacières. En étudiant les 220 besoins en lien avec cet objet du quotidien, l'étude introduit une distinction fondamentale entre trois types de besoins — et c'est ici que l'exemple des glacières devient rafraichissant.
Les besoins de base. Ce que le client tient pour acquis, ce qu'il ne mentionne même pas parce que c'est évident pour lui. Par exemple : que la glacière garde le froid. Personne ne vous le dira en entrevue, parce que personne ne pense qu'il faut le préciser. Mais si votre glacière ne garde pas le froid, c'est terminé. Ces besoins-là, on les rate quand on ne fait pas assez d'entrevues — il faut du temps et de la confiance pour que les gens vous disent ce qui va tellement de soi qu'ils ne le formulent pas.
Les besoins articulés. Ce que le client va vous dire spontanément quand vous lui posez la question. « J'aimerais qu'elle soit facile à transporter. » « J'aimerais qu'elle ne coule pas dans le coffre de la voiture. » « J'aimerais pouvoir la nettoyer facilement. » C'est le territoire le plus accessible — et c'est aussi celui que le sondage capte le mieux, à condition qu'on ait déjà pensé à poser la bonne question.
Les besoins excitants. Ceux qui, s'ils sont satisfaits, créent de la surprise et du plaisir — mais que le client n'aurait jamais formulés de lui-même. C'est la glacière qui sert aussi de siège au bord du lac. C'est le compartiment sec intégré pour les clés et le téléphone. C'est le système d'ouverture à une main quand on a l'autre prise par les sacs d'épicerie. Ce sont ces besoins-là qui créent la préférence, la loyauté, le bouche-à-oreille. Et ils n'apparaissent jamais dans un sondage, parce que personne ne peut cocher une case pour un besoin qu'il n'a pas encore imaginé.
Les besoins de base, on les rate quand on ne fait pas assez d'entrevues. Les besoins excitants, on les rate quand on ne fait que des sondages. Dans les deux cas, c'est l'entrevue qualitative qui fait la différence.
Griffin et Hauser ne se sont pas arrêtés là. Ils ont aussi montré comment organiser ces 230 besoins dans une hiérarchie qui permet à tout le monde dans l'organisation de parler le même langage — celui du client.
Au sommet : cinq à dix besoins stratégiques. Pour la glacière, ça pourrait être « garder mes aliments en sécurité » ou « être facile à utiliser en déplacement ». Ce sont ceux qu'un comité de direction utilise pour prendre les grandes décisions.
Au milieu : une vingtaine de besoins tactiques qui précisent comment le client évalue chaque besoin stratégique. « Facile à utiliser en déplacement », ça veut dire quoi exactement? Ça veut dire légère, transportable d'une main, et qui tient dans un coffre de voiture.
Au niveau le plus fin : des centaines de besoins opérationnels — ceux qui permettent aux ingénieurs et aux designers de faire des choix concrets. La poignée doit supporter 15 kg. Le couvercle doit s'ouvrir à 90 degrés. Le drain doit être accessible sans retourner la glacière.
Cette structure fait en sorte que le VP marketing et l'ingénieur de production lisent les mêmes données, juste à des niveaux de détail différents. C'est un traducteur universel entre la stratégie et l'exécution.
Quand on accompagne des organisations — chez Perrier Jablonski, c'est notre quotidien —, on se heurte constamment à deux objections. La première : « On n'a pas le budget pour une grosse étude. » La deuxième : « Trente entrevues, ce n'est pas représentatif. »
Griffin et Hauser répondent aux deux. Non, vous n'avez pas besoin d'une grosse étude. Oui, une vingtaine d’entrevues suffit, et dans bien des cas, cinq entrevues valent mieux qu’un seul focus group — à condition qu’elles soient bien menées et rigoureusement analysées. Et non, on ne parle pas de représentativité statistique. On parle de couverture des besoins. Ce n'est pas la même chose.
La représentativité, c'est le problème du sondage : s'assurer que l'échantillon reflète la population. La couverture des besoins, c'est le problème de l'entrevue : s'assurer qu'on a entendu tout ce que les gens avaient à dire. Et sur ce terrain, quelques dizaines de conversations bien conduites battent des milliers de questionnaires.
The Voice of the Customer a été cité des milliers de fois depuis 1993. La méthode a été appliquée dans des centaines d'entreprises, de General Motors à Procter & Gamble, de Xerox à Hewlett-Packard. Elle est devenue un standard en développement de produits.
Mais son enseignement le plus durable, c'est peut-être le plus simple : pour comprendre les gens, il faut aller leur parler. Pas leur envoyer un formulaire. Pas leur demander de cocher des cases. Leur parler. Les écouter. Les laisser raconter leur histoire dans leurs propres mots.
Trente ans plus tard, cette leçon reste étonnamment difficile à faire passer. Comme si, au fond, on préférait la fausse certitude des grands chiffres à la vraie compréhension des petits nombres.
Depuis plusieurs décennies, les départements de marketing et de design se sont emparés d'un vieux terme pour décrire leurs types de clients : le fameux persona. Le persona est un personnage fictif représentant un groupe spécifique de personnes, que l'on va "incarner" par un individu créé de toutes pièces. Il sert de modèle pour comprendre les caractéristiques, les besoins, les préférences et les comportements de ce groupe. Les personas sont souvent créés à partir de recherches et de données sur les utilisateurs réels. Typiquement, on y retrouve les éléments tels que :
De planification stratégique en plan marketing, on voit les départements s'accrocher à leurs personas et en faire de véritables cibles marketing. La raison est facile à comprendre : d'abord, la simplicité. Il est plus facile de nommer Julien ou Marie que "les hommes 25-40 ans en couple, en banlieue" ou "les femmes professionnelles urbaines". Ensuite, une sorte de sentiment d'attachement se crée dans l'organisation. On va plus facilement prendre soin de Claude ou de Carole que d'un "public cible". Quel est le problème alors?
Il en existe plusieurs. D'abord, on voit souvent des contradictions ou des aberrations qui créent des personnages fictionnels, voire des superhéros du quotidien qui finissent par ne représenter personne. "Julie a 35 ans, 3 enfants en bas âge, elle vit en banlieue et travaille en centre-ville, elle fait du sport trois fois par semaine et voit ses amies souvent. Elle est très sensible aux changements climatiques. Elle a un chalet et un VUS, etc." À part dans les agences marketing, Julie n'existe pas.
Ensuite, ce persona représente la moyenne. Or nous l'avons déjà écrit dans un article, la moyenne n'existe pas. La création d'un persona moyen va pousser les départements marketing à créer une sorte de porte-parole d'un groupe, qui ne représente pas les disparités de celui-ci. Les différences sont effacées. Les incongruités sont ignorées. On dessine à grands traits un portrait idéal, uniforme, alors que c'est justement dans les subtilités de nos différences que l'innovation se cache. C'est aussi l'avis de Dan Formosa, un grand designer industriel interrogé dans le documentaire Objectified:
Certains de nos clients nous disent notre usager moyen est une femme, 42 ans, 2.3 enfants... Nous, on écoute poliment, mais... on s'en fout de cette personne. Ce qu'on a vraiment besoin de savoir pour designer, c'est le comportement des usagers extrêmes. Les plus forts ou les plus faibles, les athlètes, les plus rapides ou les moins agiles. On innove pour eux. La moyenne, elle... Elle va pouvoir s'arranger toute seule.

Cependant, il demeure un dernier problème qui nous oblige à faire un petit tour dans le passé.
L'étymologie du mot "persona" remonte au latin. Le mot latin "persona" signifiait initialement "masque" ou "visage" et était utilisé pour décrire les masques portés par les acteurs sur scène dans les théâtres romains et grecs antiques. Ces masques étaient souvent conçus pour représenter des caractères ou des types de personnages spécifiques, permettant ainsi au public de comprendre instantanément le rôle de l'acteur dans la pièce.
Au fil du temps, le sens du mot "persona" a évolué pour inclure non seulement le masque lui-même, mais aussi le personnage ou le rôle représenté par l'acteur. En fin de compte, il en est venu à représenter une identité ou un ensemble de caractéristiques adoptées par une personne dans un contexte particulier. Si on s'en tient aux origines, le persona est un personnage, pas une personne. On est donc passé du masque au personnage à la moyenne d'un groupe. Et c'est dommage...
Il existait déjà un mot pour décrire un groupe de personnes : un profil. C'est exactement la même définition — certains vous diront que le profil décrit "une personne" alors que le persona décrit un "ensemble de personnes". Mais alors on se prive d'une subtilité qui a beaucoup de valeur en anthropologie. Si le profil décrit la réalité et que le persona décrit un personnage fictif, alors on crée un écart entre ce que la personne est et ce que la personne pense ou aimerait être.
Chez Perrier Jablonski, nous sommes à la recherche d'insights en permanence, et sans trahir de secret professionnel, la vérité se cache souvent entre la réalité et le fantasme. Entre le profil et le persona. Par exemple, voici le profil d'Aurélien : il a 37 ans. Il a deux enfants et vit à Sherbrooke. Il travaille en construction. Voici le persona d'Aurélien: Aurélien se voit comme un gars de plein air qui pourrait vivre sur la route, à escalader les plus belles montagnes du pays et à vivre en pleine nature à l'année. On voit bien que ces deux Aurélien sont compatibles. On imagine bien le potentiel des insights cachés entre le profil et le persona d'Aurélien. Pourquoi Aurélien n'a-t-il pas fait le choix de vivre son rêve? Est-ce seulement un rêve ou un projet? Existe-t-il des empêchements à la réalisation de cette vie rêvée? Aurélien vit-il avec nostalgie? Comment fait-il cohabiter ces deux vies dans sa tête? Vit-il comme si il avait réalisé son rêve? Ces incohérences sont autant de questions qui pourraient nous aider à résoudre "l'énigme Aurélien". Pour faire cela, nous avons besoin d'un cadre plus solide, plus profond, et plus sérieux.
C'est à Carl Gustav Jung, un immense psychologue du XXe, que l'on doit l'idée d'archétype. Ce sont des modèles de comportement — ou de personnalité — qui ont un caractère universel et intemporel. On les retrouve dans les mythes, les légendes, les religions, la littérature et même le cinéma ou la télévision. Ils peuvent servir dans la création d'un persona, dans le sens qu'ils représentent une sorte de "caricature inspirante" — qui aurait l'avantage d'être compréhensible par tous. L'archétype devient alors un "super-persona" caricatural, certes, mais universel.
En voici quelques-uns :

Ils sont très pratiques à plusieurs égards. D'abord parce qu'ils sont clairs, évidents. Ensuite, parce qu'ils représentent la psyché humaine, qui est riche et complexe. Enfin parce qu'ils peuvent s'additionner dans la composition de votre persona. L'archétype nous permet alors d'assumer que l'humain en face de nous n'est pas simple... et l'insight peut nous permettre de résoudre notre énigme. Si Aurélien (avec son profil) n'agit pas conformément aux principes qu'il déclare (son persona), c'est sans doute qu'il a une personnalité complexe (son archétype).
Ainsi, pour éviter le piège du persona, on aurait avantage à décrire notre Julie comme un mélange de "profil-persona-archétype" — que nous avons renommé le P.A.P par convenance. Par exemple comme une femme de 42 ans, professionnelle, d'un niveau universitaire, qui habite en banlieue et travaille en centre-ville, qui aime le plein air et habite un 5½. Elle se voit comme une femme libre et proche de la nature, mais elle ne vit pas ce rêve. Pourquoi? Parce qu'elle a deux enfants, et que son rôle de mère passe avant tout. Mi-figure maternelle, mi-héroïne, elle a besoin d'être encouragée, supportée et valorisée. Elle n'a pas mérité de nouvelles injonctions ou des leçons de morale. Nous allons donc devenir la marque qui va faciliter sa vie, l'encourager et la soutenir, en faisant ceci ou cela.
À l’approche du nouveau millénaire, Karin Knorr Cetina, une sociologue autrichienne, a tenté de comprendre comment nous en venons à développer le savoir sur un sujet. Ses travaux ont principalement porté sur deux pans de la science, soit la physique des hautes énergies (pensez à l’accélérateur de particules du CERN) et la biologie moléculaire, au cours desquels elle a étudié les chercheurs travaillant sur des projets d’envergure. Parmi ses nombreuses découvertes, elle a observé qu’un aspect essentiel de la recherche est le « savoir négatif ».
Dans Epistemic Cultures, elle définit le savoir négatif comme « non pas la non-connaissance, mais la connaissance des limites de la connaissance, des erreurs que nous commettons en essayant de savoir, des choses qui interfèrent avec notre connaissance, qui ne nous intéressent pas vraiment et que nous ne voulons pas savoir. » Bref, c’est savoir qu’on ne sait pas.

Ne pas être conscient que l’on ne sait pas peut avoir des effets désastreux. Prenez l’exemple de McArthur Wheeler qui, en 1995, a cambriolé deux banques à Pittsburgh. L’homme de 44 ans s’est présenté face aux employés sans effort apparents pour masquer son identité. C’est donc à visage découvert qu’il a commis ses crimes. Quelques heures après son deuxième cambriolage, la police l’a facilement retrouvé en utilisant les caméras de sécurité. Lorsque les policiers ont montré les images captées par les caméras, où l’on peut le voir très clairement, Wheeler semblait confus. « Mais, je portais le jus », a-t-il balbutié. Voyez-vous, selon le cambrioleur, s’il s’étendait du jus de citron sur le visage, il deviendrait invisible aux yeux des caméras.
Ce fait divers assez loufoque a amené Justin Kruger et David Dunning à étudier les gens qui surestiment leurs compétences ou leurs connaissances sur un sujet donné. Leur plus grande conclusion ? Les gens qui ne réalisent pas les limites de leur propre connaissance auront souvent tendance à prendre de très mauvaises décisions.
Charles Darwin disait que « l’ignorance génère davantage de confiance que ne peut le faire la connaissance ». Ainsi, l’effet Dunning-Kruger (énoncé par les mêmes chercheurs) stipule que les gens qui ont peu de connaissances sur un sujet auront souvent tendance à être beaucoup trop confiants en leur capacité. Les auteurs précisent que le savoir négatif permet d’atténuer l’effet Dunning-Kruger, et d’augmenter grandement les probabilités de prendre de bonnes décisions. Pour y parvenir, nous devons développer la capacité de porter un regard candide sur les problèmes auxquels nous faisons face.

La valeur de la candeur a été démontrée dans une étude menée par Peter Skillman et Tom Wujec. Cette étude nommée « Marshmallow Challenge » mettait au défi quatre équipes afin qu’elles bâtissent une structure à partir de spaghettis, de corde, de ruban adhésif et d’une guimauve. On y retrouvait des équipes constituées de diplômés d’une école de gestion, de PDG d’entreprises, d’avocats et finalement, de diplômés de… la maternelle!
Voici ce que l’étude révèle : les adultes ont tendance à vouloir trouver LA bonne solution. Plutôt que d’admettre qu’il est possible d’avoir tort, ces équipes passaient la majorité de leur temps à planifier l’édification de la structure. Le résultat : elles incorporaient la guimauve à la toute fin du processus, et dans la majorité des cas, la structure s’effondrait.
Les enfants, quant à eux, avançaient par essais et erreurs. Ils ne savaient pas ce qui fonctionnerait ou pas. Ils l’essayaient, tout simplement. En approchant le problème d’un regard candide, ils apprenaient de leurs erreurs. En moyenne, les équipes d’enfants à la maternelle parvenaient à construire des structures beaucoup plus hautes que celles des autres équipes.
En tant que consultants, nous évoluons dans une industrie dans laquelle les entreprises se font payer de fortes sommes pour trouver la bonne réponse à un problème. Certains joueurs peuvent se vanter d’avoir une expertise dans certains secteurs d’activité, certes, mais le monde dans lequel nous vivons évolue bien trop rapidement pour qu’un seul expert puisse avoir la réponse à tout.
Chez Perrier Jablonski, nous considérons que la candeur est notre plus grande alliée, puisqu’elle nous permet d’aborder tous nos mandats avec humilité et ouverture d’esprit. La bonne réponse existe assurément, mais elle se trouve parfois à un endroit où l’on n’aurait jamais pensé regarder. Il suffit de se donner la permission de la découvrir.