Initialisation · 00:00:00

Tom LEFRERE · Data Scientist

Des données. Un signal.

0%
FR EN

← Portfolio

· data · dataiku · node · playwright · python

Answer, un question answering sur documents

Fork enrichi du projet Answer de Dataiku pour la visualisation RAG, avec des fonctionnalités supplémentaires demandées par les clients.

Answer, un question answering sur documents

Le projet

Answer, pour le coup, c’est un fork du projet Answer de Dataiku, qui propose une visualisation de RAG. C’est une webapp clé en main, mais au quotidien il manquait pas mal de fonctionnalités, et mes clients demandaient régulièrement des améliorations. Du coup, j’ai décidé de prendre les choses en main en créant ce fork pour y ajouter ce qui manquait. C’est typiquement le genre de cas où on pourrait attendre un release officielle, mais bon, en consulting, ça ne marche pas trop comme ça.

Mes contributions

Fork et enrichissement de l’application originale : ajout de fonctionnalités demandées par les clients, amélioration de la visualisation RAG, corrections et adaptations pour les cas d’usage réels rencontrés en entreprise. L’idée étant de garder une version utilisable tout de suite, sans attendre que l’upstream bouge.

Ce que j’ai retenu

Reprendre un projet open source existant et l’adapter aux besoins réels du terrain, c’est un exercice très formateur. Ça m’a notamment permis de comprendre en profondeur le fonctionnement du RAG, et les attentes concrètes des utilisateurs en entreprise, qui sont souvent assez loin des cas de démo qu’on voit dans les présentations.

Contexte

Projet professionnel. En tant que consultant, je constatais des manques récurrents dans l’outil de visualisation RAG de Dataiku. Plutôt que d’attendre, du coup, j’ai forké le projet pour y répondre, quitte à devoir re-synchroniser plus tard si l’upstream intégrait les mêmes idées.

Technologies utilisées

  • Python

  • Node.js

  • Gulp (build system)

  • Playwright (tests)

  • OpenAPI

  • Dataiku

L’image d’illustration a été générée par Nano Banana (Google), parce que je n’ai plus le modèle de mockup que j’utilisais auparavant. Du coup, il ne s’agit pas d’une capture d’écran de l’outil.