L’an dernier j’avais déjà amélioré le fonctionnement de ma galerie pour automatiser les tâches fastidieuses et qui n’ont pas une forte valeur ajoutée.

Je vais vous présenter le workflow complet de la galerie.

Etape 1 : La saisie et chargement de la photo

Après avoir identifié la photo, j’utilise la fonction de chargement de la galerie « Piwigo » afin de charger la photo et ajouter quelques éléments : Nom de l’espèce, Stade (Imago, Chenille, Chrysalide), Lieu (quand il n’est pas récupéré automatiquement à partir des données de la photo).

Temps pour une image : 30 secondes


Etape 2 : Le « bus » de données

Après avoir chargé l’image, le bus de données va se déclencher, il va récupérer les données suivantes :

Taxref : Il va interroger le référentiel pour récupérer le N° d’identification, le lien vers la fiche de l’espèce, les synonymes, la famille, la sous-famille, le genre, la tribu, l’habitat, les listes rouges de protection.

GBIF : Le bus récupère le numéro du référentiel GBIF, le lien vers la fiche.

Lepinet : En consultant le site de Lepinet, le n° Leraut, le n° Robineau (si connu), le lien vers la fiche, la nourriture de la chenille.

Sites : Pour permettre l’ouverture vers les autres site, le bus va intégrer automatique un lien vers la fiche de l’espèce sur les sites suivants : Artemisiae, Lepiforum, Papillons du Poitou-Charentes (Antoine Guyonnet)

Temps pour une image : 15 secondes


Etape 3 : Les robots

Après avoir identifié un certain volume de photos, deux robots vont publier automatiquement les données sur les portails d’Artemisiae et de Nature79.

Les robots chargement les images, les données complètes sur le portail et vont déclencher dans le bus de données un évènement pour signaler que la photo est postée sur le portail, un lien vers l’observation est ajouté sur la galerie.

Nature79 : Temps pour une image : 15 secondes

Artemisiae : Temps pour une image : 30 secondes


Etape 4 : Les corrections

Mes identifications peuvent comporter des erreurs (le taux diminue avec le temps …), ma galerie ne gère pas les complexes de données (lorsqu’il n’est pas possible d’aller jusqu’à l’espèce nous identifions en « sp. » en s’arrêtant au genre, sur certains portails il est possible d’avoir un complexe qui regroupe plusieurs genres). De plus, certains portails n’ont pas la dernière version du Taxref.

Des automates vont vérifier l’adéquation entre les identifications faites sur les portails et la galerie, les corrections sont envoyées sur la galerie par l’intermédiaire du bus de données, qui va procéder à la correction sur la galerie. C’est le programme de vérifications des écarts qui fait ce travail.

Par moment les robots génèrent des doublons de saisie (en cours d’amélioration), un programme de vérification des doublons va contrôler les données des portails. Si il y a un doublon cela « post » une demande au bus de données, qui prendra en charge la suppression de l’observation en double sur le portail concerné.

Temps pour une image : 1 à 2 minutes


Etape 5 : Vérifications des noms de fichiers

Les photos sont déposées sur mes serveurs de fichiers, elles sont organisées avec l’arborescence suivante :

  • Département
    • Lieu et date de la chasse
      • Identifiées
      • Non Identifiées

Quand une chasse est complète l’arborescence change et devient :

  • Département
    • Complets
      • Lieu et date de la chasse

Les photos sont nommées avec la norme suivante :

<Lieu> – <Département > – <Date avec le mois en chiffre romain> – <Espèces> – <Observateur> – <Référence interne de la galerie>

Exemple : Amuré – Dpt (79) – 01-VI-2012 – Agrotis segetum – Nicolas Sellier – 453

Lorsqu’il y a des modifications d’identification sur la galerie, un robot va lancer un contrôle du nom de fichier et le corriger afin d’avoir toujours la bonne traçabilité entre la données dans la galerie et le fichier physique de la photo.

Temps pour une image : 1 minute


Etape 6 : L’export des listes

Chaque jour un export des données, seulement pour les lépidoptères est envoyé vers un Google Sheet et aussi un fichier excel.

Temps pour une image : 1 seconde

J’espère que cette description des différentes étapes est suffisamment claire. Le but de ce système d’information est d’améliorer le niveau de qualité et de certification des données, gagner un maximum de temps sur la diffusion et gestion des photos (6000 environs identifiées aujourd’hui). Un des objectifs est aussi d’avoir une traçabilité complète de toutes les opérations d’identifications et donc pouvoir suivre l’historique d’une photo entre la prise de vue, l’identification, le classement.


Voici les briques techniques utilisées pour l’ensemble du système d’information :


Retrouver l’ensemble des mes photos sur la galerie : https://galeriemacro.nsellier.fr/

(Attention certaines données ne sont pas visbiles en consultation « mobile »)