Visualisation de données YouTube
Analyse et visualisation de ma consommation YouTube avec PowerBI et Python.
Le projet
Depuis quelques mois, ma consommation YouTube a pas mal évolué. Les Shorts ont fait leur apparition dans mon quotidien, alors que je les évitais jusque-là, et c’est quelque chose qui m’a intrigué assez vite. Du coup, cette petite curiosité m’a poussé à analyser mes habitudes de visionnage pour mieux les comprendre, notamment pour voir si je regardais vraiment autant de Shorts que mon impression me le laissait croire.
Les données
J’ai récupéré mon historique complet via Google Takeout, puis monté une application PowerBI pour visualiser mes données de consommation. L’idée étant d’avoir quelque chose d’interactif, pour pouvoir creuser au fil des questions qui se posent.
Premières visualisations
Voici les axes que j’ai explorés en premier :
-
Top des chaînes par nombre de vidéos vues.
-
Top des chaînes auxquelles je suis abonné.
-
Vidéos les plus regardées.
-
Répartition temporelle (année, trimestre, mois, jour).
Shorts contre vidéos classiques
Premier problème, pour le coup : YouTube ne distingue pas les Shorts des vidéos classiques dans les données exportées. En creusant, j’ai découvert que l’URL des Shorts contient un chemin /shorts/[id], ce qui m’a permis de les identifier et de créer une visualisation dédiée à cette répartition. C’est pas très élégant comme technique, mais ça marche bien.
Autres visualisations
Distribution des langues. En réutilisant la logique de mon projet Any%English, j’ai identifié la langue de chaque vidéo regardée : français, anglais, allemand, japonais (probablement les Shorts, d’ailleurs).
Nuage de mots. Généré à partir des descriptions des vidéos regardées, il fait ressortir mes thématiques récurrentes : musique, jeux vidéo, voyages. Rien de très surprenant pour le coup, mais c’est toujours sympa de le voir chiffré.
Catégories les plus regardées. Musique, jeux vidéo, et divertissement arrivent en tête.
Motivations
Ce projet répondait à une vraie question personnelle sur mes habitudes numériques, et en même temps il m’a permis de monter en compétences sur PowerBI, que je connaissais moins bien que Tableau Software. Du coup, c’est un double bénéfice, ce qui est toujours agréable sur un projet perso.
Technologies utilisées
-
PowerBI
-
Python
-
YouTube Data API v3