J’utilise pour la transcription de mon podcast un service automatique basé sur l’intelligence artificielle. Les transcriptions sont presque parfaites mais l’intelligence artificielle n’est pas encore à la hauteur de certaines règles (vicieuses) de notre grammaire. Par exemple l’accord du participe passé de notre passé composé. Pas facile !
Écoutez le podcast sur votre plateforme préférée (Apple, Google, Spotify, etc.)
TRANSCRIPTION
Transcription int – Sonix.mp3: Audio automatically transcribed by Sonix
Transcription int – Sonix.mp3: this mp3 audio file was automatically transcribed by Sonix with the best speech-to-text algorithms. This transcript may contain errors.
Bonjour à tous, c’est Pierre-Marie ! おはようございます、 good morning ! Et aujourd’hui j’ai envie de rajouter « Assalamu alaykum » pour nos amis marocains contre lesquels nous allons jouer dans deux jours une demi-finale de coupe du monde de football.
Alors quand je vais poster ce podcast sur mon site internet, eh bien le match sera déjà passé, donc vous saurez déjà le résultat. Mais pour moi, au moment où j’enregistre ce podcast, et bien je ne sais pas ce qui va se passer entre la France et le Maroc, mercredi matin à l’aube, heure japonaise, 4 h du matin. Je pense que je vais essayer de me lever pour ce match. Je ne sais pas ce qui va se passer, mais j’espère que ce sera un beau match et « Que le meilleur gagne ! » comme on dit.
Vous êtes bien dans un nouvel épisode de mon podcast French by ear – フランス語の聞き取り et nous n’allons pas parler de football, mais j’ai envie aujourd’hui de vous parler de transcription, d’intelligence artificielle et de l’accord du participe passé en français… qui est parfois un peu compliqué.
Donc quand j’enregistre mon podcast, je fais un fichier audio dans un format classique, c’est à dire en général le format mp3 et ensuite je télécharge ce fichier sur un site internet qui s’appelle Sonix et qui est donc un service de transcription automatique. Automatique, ça veut dire que ce service, cette transcription est effectuée non pas par des êtres humains ou des spécialistes en français, mais bien par des robots, par des machines, par des ordinateurs.
Avant de commencer à faire ce podcast, je n’avais jamais utilisé ce genre de service. Donc c’était vraiment pour moi la première fois. Et je dois dire que j’ai été totalement bluffé, totalement estomaqué (ぽかん – flabbergasted) par la qualité de la transcription automatique et donc par, quelque part, le talent de l’intelligence artificielle.
Une fois que le service Sonix a terminé de faire la transcription de mon fichier audio, et bien j’ai la possibilité de faire des corrections bien sûr dans cette transcription, mais en général il y a très peu de corrections à faire et c’est ce que je trouve particulièrement étonnant, c’est que simplement avec le son de ma voix, les mots parlés, eh bien Sonix me donne un fichier écrit qui fait pratiquement trois ou quatre pages selon la longueur du podcast. Mais sur ces trois ou quatre pages, il n’y a pratiquement pas de fautes de français.
Je pense que si, avec ce même fichier audio, on faisait une dictée et qu’on faisait faire cette dictée à cent Français moyens choisis au hasard dans la rue comme ça, et bien le résultat de la dictée des français serait beaucoup plus mauvais que la transcription de Sonix. Et donc, et donc, et donc on peut conclure (結論づける – conclude) pratiquement que l’intelligence artificielle est meilleure en dictée que le Français moyen.
Alors c’est à la fois totalement fascinant (魅力的 – fascinating) et je suis admiratif. Mais, quelque part (何となく – somehow), il y a toujours, en tout cas pour moi, une idée un peu angoissante, je sais pas, mais en tout cas, je suis un peu mal à l’aise de voir que dans des situations comme celle-ci, qui sont de fournir un travail intellectuel, les machines sont supérieures ou au moins égales à l’homme.
Ça me fait penser de temps en temps, on voit dans les informations, il y a des parties de jeu d’échecs (チェス – chess) où on oppose un ordinateur aux meilleurs joueurs d’échecs dans le monde. Et si je me souviens bien, c’est souvent l’ordinateur qui gagne. Donc il y a toujours un peu cette idée de match, de compétition entre la machine et l’homme. Et personnellement, je suis toujours un peu content quand c’est l’homme qui gagne.
Et dans ces transcriptions de Sonix, donc il y a quand même toujours un moment où c’est l’homme qui gagne, ou en tout cas c’est la grammaire française et les difficultés de la grammaire française qui gagnent et qui sont supérieures à l’intelligence artificielle. Et bien ce moment-là, en général, c’est l’accord du participe passé dans l’utilisation, bien sûr, du passé composé.
Alors si vous étudiez le français depuis un moment, puisque vous êtes déjà au niveau intermédiaire, vous savez bien sûr que l’accord du participe passé, c’est une règle particulièrement difficile en français. Et certainement, de temps en temps, vous faites des fautes. Et bien rassurez-vous, vous n’êtes pas tout seuls.
L’intelligence artificielle, je dirais même les meilleurs ordinateurs de la Silicon Valley, le nec plus ultra (最新鋭 – state-of-the-art) des ordinateurs de la Silicon Valley, ne comprend rien à l’accord du participe passé des verbes qui utilisent l’auxiliaire avoir quand le complément d’objet direct est placé avant le verbe.
Je m’en suis rendu compte en enregistrant le podcast sur les sandales de Steve Jobs où il y avait une phrase du type « Les sandales qu’il a portées ont été vendues aux enchères » ou quelque chose comme ça. En tout cas « les sandales qu’il a portées ». L’accord du participe passé correct, c’est portées « é-e-s » puisque « les sandales », c’est le complément d’objet direct et il est placé devant le verbe. Donc les sandales qu’il a porté « é-e-s ». Eh bien ça, ce genre de petites subtilités (可笑しいさ – subtleties) de la langue française, l’intelligence artificielle n’y comprend rien, l’intelligence artificielle s’emmêle les pinceaux (縺れる – get entangled) et personnellement, je ne sais pas pourquoi, mais ça me fait un peu plaisir. C’est comme une petite victoire.
Je dois reconnaître quand même que c’est une règle particulièrement vicieuse (悪質 – vicious) du français. Et d’ailleurs, si on y réfléchit tranquillement, ce n’est pas une règle qui sert à grand chose en fin de compte, c’est simplement une règle, je ne sais pas pour faire la différence entre les experts en grammaire et les gens normaux.
Et j’ai dit tout à l’heure que l’intelligence artificielle ne comprenait pas cette règle et faisait systématiquement la faute. Mais elle n’est pas la seule. Si vous prenez encore une fois une centaine de Français, et bien je pense qu’il y en aura plus de la moitié qui vont faire cette faute et qui vont écrire « les sandales qu’il la porté ». Et ils ne vont pas accorder le participe passé aux sandales qui ont été placées avant le verbe parce que parce que… eh bien, peut-être, c’est des anciens souvenirs d’école, et puis finalement, ce n’est pas tellement important. En tout cas, ce n’est pas tellement important pour comprendre la phrase et pour comprendre ce qu’on souhaite communiquer. C’est simplement une petite erreur d’accord, une petite erreur d’orthographe même, on pourrait dire, mais qui n’a pas vraiment de conséquences, qui ne nous empêche pas de comprendre la phrase, de comprendre ce qui se dit.
C’est vrai qu’il y a régulièrement des personnes qui pensent que ce serait une bonne idée de simplifier ce genre de règles. Je ne sais pas ce que vous en pensez, vous, de votre côté. Est-ce que pour vous c’est une règle qui est facile ou si c’est une règle qui vous rend fou ? N’hésitez pas si vous le souhaitez à m’envoyer un petit commentaire sur mon site internet.
Donc si on résume et un petit peu à la manière d’un score de football, on pourrait dire aujourd’hui : Accord du participe passé 1 – Intelligence artificielle 0. Eh bien, la grammaire française reste toujours, même si c’est sur un point particulièrement difficile, reste toujours supérieure à l’intelligence artificielle. Personnellement, j’aime bien cette idée.
Je voudrais finir sur deux petites remarques concernant la transcription de mon podcast. D’abord, bien sûr, je conseille de ne pas l’utiliser ! Enfin, pour être précis, je conseille de ne pas l’utiliser dès le départ. Puisque mon podcast est destiné à vous aider à mieux comprendre le français parlé, « à l’attraper avec l’oreille » comme je dis souvent, il est donc mieux de ne pas commencer avec la transcription puisque si, dès le départ vous utilisez la transcription, en fait vous lisez la transcription plus que vous n’écoutez le texte.
Deuxième remarque que je souhaitais faire : mon podcast c’est du français parlé. Mon texte n’est pas écrit à l’avance, je mets juste quelques notes sur une feuille de papier avec deux ou trois points dont je veux parler. Mais ensuite c’est un peu de l’improvisation (即興 – improvisation). Et donc comme c’est du français parlé et de l’improvisation, et bien de temps en temps, ce n’est pas absolument parfait. Il y a des hésitations, il y a des phrases que je commence et que je ne finis pas… Il y a aussi des tics de langage, mais ce n’est pas grave. Encore une fois, c’est du français parlé. Et la transcription, elle vous sert surtout à identifier les mots que vous ne comprenez pas. Mais ça n’est sûrement pas une base pour faire par exemple de la grammaire.
Voilà, c’est tout pour aujourd’hui. Je vous dis donc à la prochaine fois, また次回.
Sonix is the world’s most advanced automated transcription, translation, and subtitling platform. Fast, accurate, and affordable.
Automatically convert your mp3 files to text (txt file), Microsoft Word (docx file), and SubRip Subtitle (srt file) in minutes.
Sonix has many features that you’d love including transcribe multiple languages, secure transcription and file storage, automated translation, automatic transcription software, and easily transcribe your Zoom meetings. Try Sonix for free today.
Photo Alex Knight – Unsplash
Laisser un commentaire