Cinéma, télévision et vidéo en ligne

Contrairement aux images fixes, qui s’appuient uniquement sur la composition et des éléments visuels statiques, les médias audiovisuels dirigent aussi l’attention du spectateur grâce à des règles de mise en avant qui reposent sur le mouvement, le montage et le son.

Mouvement

La différence fondamentale entre l’image fixe et la vidéo est le mouvement. Celui-ci prend deux formes, soit le mouvement à l’intérieur du cadre et le mouvement de la caméra, qu’il soit réel ou virtuel[1].

Lorsque quelque chose bouge dans l’image, notre regard le suit. Cela attire notre attention, mais peut aussi produire d’autres effets[2]. Un personnage qui se déplace en lignes droites pourra être perçu comme honnête et direct, ou au contraire inflexible et conflictuel. Un personnage qui se déplace en courbes pourra sembler sournois, mais aussi gracieux ou coopératif. Un même personnage peut d’ailleurs adopter des mouvements courbes lorsqu’il est détendu, puis passer à des déplacements rectilignes lorsque la situation devient plus urgente ou intense[3].

En plus de diriger l’attention du public, le mouvement de la caméra peut être utilisé pour créer de la tension ou provoquer la surprise en retardant la révélation de certains éléments. Il existe quatre principales techniques de mouvement de caméra, et donc de déplacement du cadre :

  • Le panoramique vertical : la caméra pivote vers le haut ou vers le bas. Cette technique peut être utilisée pour intensifier l’effet d’un plan en contre-plongée ou en plongée.
  • Le panoramique horizontal : la caméra pivote horizontalement, Cette technique est souvent utilisée pour intensifier l’effet d’un plan en contre-plongée ou en plongée.
  • Le zoom : la caméra reste fixe mais où l’objectif change pour réduire (zoom arrière) ou agrandir (zoom avant) l’image, ce qui donne généralement un gros plan. Cette technique permet le plus souvent de diriger l’attention du public vers un élément précis[4].

Dans chacun de ces cas, la caméra reste immobile, mais les créateurs de contenu vidéo déplacent souvent la caméra aussi. Il existe de nombreuses variations de ce type de plan, selon la manière dont il est réalisé : sur des rails, avec un chariot, à la main, à l’aide d’une grue ou d’un drone, ou encore grâce à des technologies spécialisées comme la Steadicam. Chacune de ces techniques est utilisée pour produire des effets particuliers[5].

Ces effets peuvent également être combinés. Cela peut répondre à des raisons narratives : les films commencent souvent par un panoramique vertical vers le bas qui s’accompagne d’un zoom ou d’un mouvement allant du plan large au gros plan, ce qui nous fait passer d’une vue d’ensemble du lieu à l’endroit précis où l’action va se dérouler. La combinaison de techniques peut aussi produire un effet émotionnel, comme le « dolly zoom » (zoom avant tout en reculant la caméra au même rythme), qui donne l’impression que l’arrière-plan s’éloigne derrière un personnage immobile et déforme ses traits[6].

Montage

Le cinéma et la télévision sont construits comme un montage séquentiel de plans continus. Un plan peut être défini comme la durée qui s’écoule entre deux transitions : dans la vidéo professionnelle, un plan typique dure environ six secondes[7]. Les plans sont ensuite montés (juxtaposés) pour former des scènes[8].

Comme pour la plupart des règles de mise en avant, le montage sert le plus souvent à nous montrer clairement ce qui se passe. Cela peut être très simple : on utilise un plan de réaction lorsque deux personnages se parlent pour montrer l’échange d’un interlocuteur à l’autre. Le montage peut aussi avoir des fonctions plus sophistiquées, en retenant ou en fournissant stratégiquement des informations. Comme l’a illustré Alfred Hitchcock, ajouter un plan montrant qu’une bombe se trouve sous une table crée une tension dans les plans suivants, avec un effet final bien plus dramatique qu’une explosion soudaine et inattendue[9]

Mais le sens d’un plan peut aussi être complètement transformé par le plan qui le suit, c’est ce qu’on appelle l’effet Koulechov, du nom du réalisateur russe qui l’a inventé. Lev Koulechov a montré que lorsqu’un public voyait un plan montrant un homme au visage impassible suivi d’un plan d’un enfant dans un cercueil, il interprétait l’homme comme étant triste, tandis que le même plan de l’homme, suivi cette fois d’un plan d’un bol de soupe, amenait les spectateurs à croire qu’il avait faim[10].

Parfois, l’absence de montage devient une technique en soi. Les plans-séquences, où une scène ou même un film entier est tourné en une seule prise continue, créent une immersion plus forte et une tension particulière[11].

Les transitions, qu’il s’agisse de coupes, de volets, de panoramiques, de zooms ou de fondus, ne sont pas de simples choix stylistiques. Elles servent d’indices pour signaler un changement de lieu, de temps, de personnage ou d’action[12].

Différentes transitions peuvent également produire des effets particuliers, par exemple :

  • Les coupes sont la transition la plus basique, un plan suivant directement un autre. Elles sont généralement plus ou moins invisibles pour le spectateur, mais pas toujours. Un match cut attire l’attention sur la transition en coupant entre deux images ayant une forte similarité visuelle (comme l’os et la station spatiale dans 2001 : L’Odyssée de l’espace de Kubrick), tandis que les jump cuts utilisent des compositions visuellement différentes pour surprendre le spectateur ou montrer le passage du temps[13].
  • Les coupes au noir, au moment culminant d’un événement narratif, incitent le spectateur à imaginer la suite, renforçant ainsi son engagement[14].
  • Les fondus enchaînés, où le deuxième plan se superpose progressivement au premier, servent souvent à signaler un changement de lieu ou le passage du temps[15].
  • Les zooms extrêmes sont efficaces pour mettre l’accent sur un élément ou renverser les attentes, souvent utilisés dans les styles « documentaires parodiques » pour briser le quatrième mur[16].
  • Les panoramiques filés, où la caméra effectue un panoramique très rapide d’un sujet à un autre tout en utilisant un fondu pour créer un effet de flou, peuvent surprendre ou désorienter[17].
  • Les arrêts sur image avec zoom avant, qui s’attardent sur un moment crucial, intensifient la concentration du spectateur[18].

En général, les coupes simples sont utilisées à l’intérieur d’une scène, tandis que les transitions plus visibles servent à passer d’une scène à une autre. Il existe toutefois des exceptions : ainsi, même si une scène de dialogue naturaliste utilise habituellement des coupes entre les personnages qui parlent, elle peut aussi être filmée avec des panoramiques filés pour donner une impression de désorientation ou traduire l’excitation grandissante des personnages.

Son

Bien qu’il soit souvent négligé dans l’analyse visuelle, le son est un élément essentiel des médias audiovisuels : il fournit des informations et des indices émotionnels impossibles à transmettre par des images fixes[19].

Le dialogue et la narration communiquent des informations, clarifient les intentions des personnages et aident les spectateurs à comprendre l’évolution du récit. Les jeunes enfants apprennent progressivement à combiner les éléments sonores et visuels pour construire du sens.

Les effets sonores fournissent des indices sur le contenu, signalent des changements et attirent efficacement l’attention visuelle vers l’écran. Les effets sonores synchronisés avec des actions peuvent même faciliter l’imitation et l’apprentissage chez les nourrissons. Les effets sonores et les dialogues servent le plus souvent à nous montrer ce qui se passe, même s’il est important que les élèves comprennent que même les sons apparemment les plus « réalistes », comme ceux des documentaires animaliers, sont presque toujours ajoutés en postproduction[20].

La musique est un puissant outil pour influencer l’humeur et les réactions émotionnelles du public, orientant subtilement ce qu’il ressent face à une scène, par exemple en utilisant une musique qui « s’insinue progressivement » pour créer du suspense[21]. Avant même que l’histoire ne commence, la musique peut jouer un rôle majeur dans l’établissement de l’univers dans lequel elle se déroulera. C’est particulièrement vrai pour les œuvres épisodiques comme les séries télé, les publicités ou les franchises cinématographiques : comme le dit le producteur David E. Kelley, le générique d’ouverture « donne le ton de la série »[22].

Dans la vidéo, le son peut être utilisé de manière diégétique (c’est-à-dire qu’il fait partie de la réalité de l’œuvre, par exemple lorsque l’on entend la musique écoutée par un personnage) ou extradiégétique[23]. Le dialogue est le plus souvent diégétique, mais peut parfois être extradiégétique, comme la narration hors champ. Un son peut également commencer dans un registre et passer à l’autre : par exemple, le tic-tac diégétique d’une horloge dans une scène peut se poursuivre de manière extradiégétique dans la scène suivante afin de créer de la tension.


[1] Hutson, J. P., Chandran, P., Magliano, J. P., Smith, T. J., & Loschky, L. C. (2022). Narrative comprehension guides eye movements in the absence of motion. Cognitive Science, 46(5), e13131.

[2] Tan, E. S. (2018). A psychology of the film. Palgrave Communications, 4(1).

[3] Block, B. (2001) The Visual Story. Routledge.

[4] Block, B. (2001) The Visual Story. Routledge.

[5] Block, B. (2001) The Visual Story. Routledge.

[6] Rose, A. (2025) How Are Those 'Severance' Elevator Transitions Created? Collider.

[7] Anderson, D. R., & Hanson, K. G. (2010). From blooming, buzzing confusion to media literacy: The early development of television viewing. Developmental review, 30(2), 239-255.7

[8] Garrison, A. (1999) Video Basics and Production Projects for the Classroom. Center for Media Literacy.

[9] Schulz, K. (2024) The Secrets of Suspense. The New Yorker.

[10] (n.d.) Kuleshov Effect: Everything You Need to Know. Nashville Film Institute.

[11] Giardina, C. (2025) How Oners Created Tension in ‘Severance,’ ‘Adolescence’ and ‘The Studio.’ Variety.

[12] Garrison, A. (1999) Video Basics and Production Projects for the Classroom. Center for Media Literacy.

[13] Heckmann, C. (2021) Types of Editing Transitions in Film — The Ultimate Guide.

[14] Alter, K. (2021) 25 Modern Internet Videos That Have Defined the Form. Vulture.

[15] Shorter, R. (2024) The 9 Essential Video Transition Effects. Boords.

[16] Alter, K. (2021) 25 Modern Internet Videos That Have Defined the Form. Vulture.

[17] Lukan, E. (2024) The 9 Essential Video Transition Effects. Synthesia.

[18] Alter, K. (2021) 25 Modern Internet Videos That Have Defined the Form. Vulture.

[19] Anderson, D. R., & Hanson, K. G. (2010). From blooming, buzzing confusion to media literacy: The early development of television viewing. Developmental review, 30(2), 239-255.7

[20] Pollard. D. (2024) The animal sounds in most nature documentaries are made by humans — here’s how they do it and why it matters. ABC News (Australia).

[21] Anderson, D. R., & Hanson, K. G. (2010). From blooming, buzzing confusion to media literacy: The early development of television viewing. Developmental review, 30(2), 239-255.7

[22] Quoted in Burlingame, J. (2023) How the Friends Theme Song Helped Save TVs Main Title Tunes From Going Extinct. Variety.

[23] Hein, E. (2023) Songs in film and television. Ethan teaches you music.