Initialisation · 00:00:00

Tom LEFRERE · Data Scientist

Des données. Un signal.

0%
FR EN

← Portfolio

· data · powerbi · python

Visualisation de données YouTube

Analyse et visualisation de ma consommation YouTube avec PowerBI et Python.

Visualisation de données YouTube

Le projet

Depuis quelques mois, ma consommation YouTube a pas mal évolué. Les Shorts ont fait leur apparition dans mon quotidien, alors que je les évitais jusque-là, et c’est quelque chose qui m’a intrigué assez vite. Du coup, cette petite curiosité m’a poussé à analyser mes habitudes de visionnage pour mieux les comprendre, notamment pour voir si je regardais vraiment autant de Shorts que mon impression me le laissait croire.

Les données

J’ai récupéré mon historique complet via Google Takeout, puis monté une application PowerBI pour visualiser mes données de consommation. L’idée étant d’avoir quelque chose d’interactif, pour pouvoir creuser au fil des questions qui se posent.

Premières visualisations

Voici les axes que j’ai explorés en premier :

  • Top des chaînes par nombre de vidéos vues.

  • Top des chaînes auxquelles je suis abonné.

  • Vidéos les plus regardées.

  • Répartition temporelle (année, trimestre, mois, jour).

Top chaînes visionnées
Top abonnements
Répartition temporelle

Shorts contre vidéos classiques

Premier problème, pour le coup : YouTube ne distingue pas les Shorts des vidéos classiques dans les données exportées. En creusant, j’ai découvert que l’URL des Shorts contient un chemin /shorts/[id], ce qui m’a permis de les identifier et de créer une visualisation dédiée à cette répartition. C’est pas très élégant comme technique, mais ça marche bien.

Shorts vs vidéos classiques

Autres visualisations

Distribution des langues. En réutilisant la logique de mon projet Any%English, j’ai identifié la langue de chaque vidéo regardée : français, anglais, allemand, japonais (probablement les Shorts, d’ailleurs).

Distribution des langues

Nuage de mots. Généré à partir des descriptions des vidéos regardées, il fait ressortir mes thématiques récurrentes : musique, jeux vidéo, voyages. Rien de très surprenant pour le coup, mais c’est toujours sympa de le voir chiffré.

Catégories les plus regardées. Musique, jeux vidéo, et divertissement arrivent en tête.

Catégories les plus regardées

Motivations

Ce projet répondait à une vraie question personnelle sur mes habitudes numériques, et en même temps il m’a permis de monter en compétences sur PowerBI, que je connaissais moins bien que Tableau Software. Du coup, c’est un double bénéfice, ce qui est toujours agréable sur un projet perso.

Technologies utilisées

  • PowerBI

  • Python

  • YouTube Data API v3