Any%English, quelle part de YouTube je regarde en anglais ?
Script Python pour calculer le pourcentage de vidéos YouTube visionnées en anglais via l’API YouTube v3.
Le projet
Une question me trottait dans la tête depuis un moment : depuis que j’utilise YouTube, quel pourcentage de mes vidéos j’ai visionnées en anglais ? C’est quelque chose d’un peu futile, évidemment, mais qui me paraissait assez parlant pour mesurer mon « exposition » quotidienne à la langue.
Après avoir vérifié les possibilités de l’API YouTube, pour le coup, j’ai constaté qu’elle ne permettait de récupérer que 50 vidéos d’historique à la fois depuis la v3. Pas suffisant pour mon volume de consommation, du coup il fallait ruser un peu.
La solution
-
Export de l’historique complet via Google Takeout.
-
Lecture et traitement des données avec Pandas.
-
Envoi des IDs vidéo par batchs de 50 à l’API YouTube v3.
-
Récupération du champ
defaultAudioLanguagepour chaque vidéo. -
Calcul du pourcentage final.
Résultat
Sur mes 16 000 dernières vidéos : 53 % en français, le reste principalement en anglais. C’est un peu plus équilibré que je ne le pensais, notamment parce que j’avais l’impression subjective d’être plutôt autour de 70/30 vers l’anglais.
Contexte
Projet personnel, né d’une simple curiosité sur mes habitudes numériques.
Technologies utilisées
-
Python
-
Scrapy / Pandas
-
YouTube Data API v3