Data&Musée

Moteur de recommandation
Data&Musée par Agence Web Kernix

Client

Data&Musée

Technos

MySQL
Natural Language Processing
Scikit-learn

Années

2017 → 2020
Projet lauréat du 23ème FUI (Fonds unique interministériel), Data&Musée avait pour objectif de faire entrer les institutions culturelles dans l’ère de la data et de l’IA.

Contexte

Kernix a fait partie du consortium de 8 sociétés qui a mené à bien ce projet entre 2017 et 2020. Le Centre des Monuments Nationaux et Paris Musées furent les partenaires culturels qui nous mirent à disposition leurs données pour mener à bien nos travaux.

En générant une masse de données considérable, les institutions culturelles ont beaucoup à gagner à les exploiter efficacement.

Les trois enjeux principaux du projet furent :

  • CRÉATION D’UNE PLATEFORME UNIQUE en regroupant les données de nombreuses institutions culturelles
  • ANALYSE DE DONNÉES CROISÉES afin de :
    • fournir aux musées des indicateurs de pilotage les aidant à définir des stratégies pour développer leurs activités
    • fournir aux visiteurs des recommandations personnalisées
  • INSCRIPTION de la mutualisation des données entre établissements dans les pratiques des institutions culturelles françaises.

Réalisation

Dans le cadre de ce projet le Kernix Data Lab fut en charge du développement d’un moteur de recommandation permettant aux partenaires culturels d’adapter le contenu du site en fonction du “profil” du visiteur.

Pour y parvenir, Kernix a tout d’abord développé un Tracker JavaScript en mesure d’identifier :

  • les sites des institutions culturelles (près d’une centaine)
  • toutes les pages de ces sites (plusieurs centaines de milliers)
  • les consultations des internautes (plusieurs centaines de millions).

Nous avons ensuite procédé à l’extraction du contenu des pages afin de calculer un vecteur sémantique pour chacune d’elles.

Ces vecteurs, qui peut être assimilés à l’ADN du contenu d’une page, furent nécessaires pour procéder à une segmentation des pages : il s’agissait par exemple d’identifier les pages consacrées aux familles (SEGMENT1), aux personnes à mobilité réduite (SEGMENT2) etc.

En combinant la segmentation des pages aux parcours des visiteurs, nous étions alors en mesure d’attribuer à chacun d’eux un segment le représentant le mieux.

Une plateforme de webservice (également développée par Kernix) fut développée pour mettre à disposition ce segment dans le contexte web afin d’adapter le contenu au visiteur (ex. proposer une popup présentant les ateliers enfants aux visiteurs associés à la classe “FAMILLE”).

Prochaine réalisation

Mucem

Moteur de recherche