Fork me on GitHub
Phraseanet Documentation

Gestionnaire de tâches

Phraseanet intègre un moteur de tâches afin de réaliser des opérations asynchrones.

Ces différentes tâches sont gérées par un Planificateur (ou Scheduler), qui s’occupe de leurs démarrages, et de leurs arrêts.

Accès au gestionnaire de tâches

  • Se connecter à l’application avec un compte Administrateur Phraseanet

  • Lancer l’interface Admin

  • Cliquer sur la rubrique Gestionnaire de tâches dans le menu latéral

    ../_images/Admin_tasks.jpg

Le Planificateur de taches (Scheduler)

Le menu contextuel du Gestionnaire de tâches (et de chacune des tâches) propose des rubriques pour démarrer, arrêter, ou consulter les logs des tâches.

Arrêts et démarrages alternatifs

Pour automatiser des arrêts et des démarrages du planificateur de tâches, utiliser l’utilitaire KonsoleKommander et l’une des commandes suivantes dans une tâche Cron par exemple.

task-manager:scheduler:pause-tasks        Pause scheduler started tasks jobs
task-manager:scheduler:resume-tasks       Resume scheduler started tasks jobs
task-manager:scheduler:run                Run the scheduler
task-manager:scheduler:state              Returns scheduler state
task-manager:task:list                    Lists tasks
task-manager:task:run                     Runs a task
task-manager:task:start                   Starts a task
task-manager:task:state                   Returns the state of a task
task-manager:task:stop                    Stops a task

Les tâches

Voir aussi

Pour l’édition de tâches, se reporter au paragraphe consacré aux tâches dans le manuel utilisateur.

Tâche d’indexation (obsolète)

Note

Cette tâche n’est plus nécessaire avec le moteur Elasticsearch.

Création des Sous Définitions

Cette tâche créé les sous définitions (images de choix et vignettes) à partir du document original.

Note

Cette tâche est nécessaire au bon fonctionnement de l’application

Ecriture des Métadonnées

Cette tâche écrit les métadonnées dans un document en fonction des réglages de la structure documentaire.

Archiver dans la collection

Cette tache permet de scruter un répertoire (Hot Folder) et d’archiver son contenu dans une Collection.

Paramètrage

  • Archive dans la base et la Collection : Choix de la collection de destination des fichiers
  • HotFolder : répertoire à scruter
  • intervalle d’exécution : intervalle entre deux exécution de la tâche
  • délais avant traitement. : Temps d’attente avant action
  • Déplacer les documents archivés dans “_archived” : garder ou pas un exemplaire du fichier traité
  • Déplacer les documents non-archivés dans “_error” : garder ou pas un exemplaire du fichier en erreur

Par défaut, TOUS les fichiers déposés dans le répetoire HotFolder (ou un sous-répertoire) sont archivés dans la collection, et décrits avec les éventuelles métadonnés incluses (IPTC, EXIF, XMP,...) en relation avec la structure de la base de destination.

Instructions propres à un (sous) répertoire du hotfolder

Un fichier .phrasea.xml dans un répertoire permet d’adapter l’archivage des fichiers à partir de ce répertoire.

  • Rediriger l’archivage vers une autre collection

Cette option permet d’avoir une tâche d’archivage unique tout en ayant des sous-répertoires du hot-folder comme autant de “boîtes de dépôt” vers autant de collections.

<?xml version="1.0" encoding="ISO-8859-1" ?>
<!--
    ici 68 est l'ID de la collection de destination.
-->
<record collection="68" />
  • Spécifier la langue des fichiers archivés
<?xml version="1.0" encoding="ISO-8859-1" ?>
<!--
    les meta-donnés des fichiers sont en français.
-->
<record lng="fr" />
  • Attendre l’APPARITION d’un fichier avant d’archiver
<?xml version="1.0" encoding="ISO-8859-1" ?>
<!--
    ici l'archivage ne commencera que lorsqu'un fichier "_ok.txt" sera déposé
    dans le répertoire concerné.
    Ce fichier sera SUPPRIME par la tâche quand l'archivage sera terminé.
-->
<record>
  <magicfile method="unlock">_ok.txt</magicfile>
</record>
  • Attendre la DISPARITION d’un fichier avant d’archiver
<?xml version="1.0" encoding="ISO-8859-1" ?>
<!--
    ici l'archivage ne commencera que lorsque le fichier "_wait.txt" sera supprimé
    du répertoire concerné.
    Un fichier sera RE-CREE par la tâche quand l'archivage sera terminé.
-->
<record>
  <magicfile method="lock">_wait.txt</magicfile>
</record>

Avertissement

Pour des raisons de sécurité, il faut créér un fichier .phrasea.xml à la racine du HotFolder.

Paramétrage étendu

Un paramétrage spécifique via la vue XML de la tâche d’archivage permet d’affiner le traitement

  • Filtrage selon le nom de fichier

Dans une section <files> il est possible de filtrer les noms acceptés en fonction d’un masque (expression régulière). Un fichier ne correspondant à aucun masque sera “en erreur” (supprimé ou déplacé dans le répertoire “_error”)

Exemple : n’accepter que les fichiers dont l’extension est ”.jpg” ou ”.JPG”

<?xml version="1.0" encoding="UTF-8"?>
<tasksettings>

  ...
  <!--
    n'accepter que les fichiers dont l'extension est `.jpg` ou `.JPG`
    Attention, la 'casse' est respectée par la tâche.
  -->
  <files>
    <file mask="^.*\.jpg$"/>
    <file mask="^.*\.JPG$"/>
  </files>
</tasksettings>
  • Description des fichiers archivés

Les fichiers archivés peuvent être décrits par une fiche d’indexation (caption) en xml. La relation entre un fichier et sa fiche descriptive s’effectue par une expression “caption”, fonction du masque.

<?xml version="1.0" encoding="UTF-8"?>
<tasksettings>

  ...
  <!--
    configuration pour l'archivage de fichiers `.jpg` et `.tif`
    décrits par des fichiers respectifs `.xml`
  -->
  <files>
    <!--
      le nom du fichier est extrait avec () pour être utilisé dans la recherche
      du fichier de description correspondant.
    -->
    <file mask="^(.*)\.(jpg|tif)$" caption="$1.xml"/>
  </files>
</tasksettings>
  • Exemple de fichier ”.xml” de description
<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<record>
  <description>
    <Objet>La Nature</Objet>
    <MotsCles>arbre</MotsCles>
    <MotsCles>terre</MotsCles>
    <MotsCles>fleurs</MotsCles>
    <Signature>Made by</Signature>
    <TitreCredits>Photographe</TitreCredits>
    <Pays>France</Pays>
    <Titre>Ballade en forêt</Titre>
    <Credit>Phraseanet</Credit>
    <Source>www.phraseanet.com</Source>
    <Date>2014-12-31</Date>
  </description>
</record>
  • Création de reportages

Il est possible de créer un “reportage” dans Phraseanet, contenant les éléments à archiver. Comme les fichiers, ce reportage peut être accompagné d’une fiche descriptive au format xml.

...
  <files>
    <!--
      Les répertoires `.grp` sont des reportages décrits par le fichier `.grp.xml`
    -->
    <grouping mask="^(.*)\.grp$" caption="$1.grp.xml" />
  </files>
...

Ici tout répertoire nommé “xxxx.grp” sera considéré comme un reportage, tous les éléments contenus dans ce répertoire (et dans les sous-répertoires) seront archivés dans un reportage Phraseanet. Le reportage (répertoire) est décrit par un fichier “xxxx.grp.xml”

  • Ajout à un un reportage existant

Si des fichiers sont ajoutés par la suite dans répertoire de reportage (répertoire ”.grp” dans l’exemple précédent), ces fichiers seront ajoutés au reportage correspondant dans Phraseanet. Le lien entre le répertoire et le reportage existe via un fichier caché ”.grouping.xml” ajouté par la tâche dans le répertoire lors de la création initiale du reportage.

FTP Push

Permet de gérer une file d’attente de documents à envoyer par FTP. Cette fonction nécessite l’activation de la fonction d’export FTP.

Paramètrage

  • proxy : adresse du proxy (optionnelle)
  • proxy port: Port du proxy (optionnel)
  • périodicité de la tache : intervalle d’exécution de la tache

FTP Pull

Permet de récupérer en local, sur l’instance, des documents depuis un server FTP. Elle peut être combinées avec la tache d’archivage afin de rapatrier et archiver des documents provenant d’un dépôt FTP distant.

Paramètrage

  • proxy : adresse du proxy (optionnelle)
  • proxy port: port du proxy (optionnel)
  • host : adresse du serveur ftp
  • port : port du serveur ftp
  • user : identifiant sur le serveur ftp
  • password : mot de passe sur le serveur ftp
  • chemin distant : répertoire d’accès distant
  • localpath : chemin de stockage local des fichiers récupérés
  • mode passif : utiliser le mode passif
  • SSL: connexion en ssl (sécurisée)
  • périodicité de la tache : intervalle d’exécution de la tache

API Bridge Uploader

Cette tache s’occupe de traiter la liste des documents à uploader via le module Bridge, vers Youtube, DailyMotion ou Flickr.

“Record Mover”

Cette tache permet de déplacer (ou de supprimer) des enregistrement d’une collection vers une autre.

Des critères de dates ou de status Phraseanet peuvent être pris en compte pour sélectionner des enregistrements.

En pratique, cette tâche peut-être utilisée pour automatiser la gestions de médias dont les dates d’échéance des droits d’utilisation approchent ou sont dépassées.

Paramètrage

  • Database : choix de la Base Phraseanet (databox)
  • intervalle d’exécution : intervalle d’exécution de la tâche
  • Collection : collection initiale ====> collection de destination
  • Status : status-bit initial ====> status-bit final

Principe de fonctionnement

La tâche Record Mover execute successivement une liste de tâches.

Une tâche recherche des enregistrements correspondants à des critères (contenus dans “from”), les met à jour (critères “to”) ou les supprime.

Interface

Les settings sont éditable en XML. L’interface affiche le SQL correspondant, le nombre de records impactés par chaque tâche (si cette tâche était exécutée maintenant), ainsi que les 10 premiers records-id’s.

Une tâche peut être maintenue ‘désactivée’ durant sa mise au point (une croix rouge est visible ).

Settings XML

<tasks> énumère l’ensemble des <task>

Une <task> agit sur une base (attribut “sbas_id”) et peut soit modifier des records, soit les supprimer (attribut “action”)

Une <task> peut être nommée (attribut “name”), le nom apparaît dans les logs.

Pour s’éxécuter, une <task> doit avoir l’attribut ” active=”1” “

Une <task> agit sur les records répondants à TOUS les critères énumérés dans la partie <from>

Les critères possibles sont

  • le type de record :
<type type="RECORD" />
seulement les documents

<type type="STORY" />
seulement les reportages
  • les collections :
<coll compare="=" id="3,5,7" />
le record est dans une des collections 3, 5 ou 7

<coll compare="!=" id="8,9" />
le record est dans n'importe quelle collection, sauf la 8 ou la 9
  • les status :
<status mask="1x0xxxx" />
le status 4 est à 0 ET le status 6 est à 1 (les status 0 à 3 sont réservés
à Phraseanet, d'ou les xxxx en fin de valeur de l'attribut *status mask*)
  • la valeur d’un champ texte :
<text field="Ville" compare="=" value="Paris"/>
la ville est Paris

<text field="Auteur" compare="!=" value="Dupond"/>
n'importe quel auteur sauf Dupond
  • la valeur d’un champ date, comparé avec la date courante :
<date direction="before" field="MISEENLIGNE"/>
la date de mise en ligne n'est pas atteinte (= on est AVANT la date de mise
en ligne)

<date direction="after" field="MISEENLIGNE" delta="+30" />
la date de mise en ligne est passée de 30 jours (= on est APRES la date+30j)

<date direction="after" field="PURGE" delta="-2" />
on est 2j avant la date de purge

Pour l’action “update”, les opérations décrites dans <to> peuvent porter sur :

  • la collection
<coll id="2" />
le record passe dans la collection 2
  • les status
<status mask="0x1xxxx" />
baisser le sb 6, lever le sb 4

Pour l’action “delete”, l’attribut deletechildren=”1” demande la suppression du contenu des regroupements supprimés.

Exemples

<?xml version="1.0" encoding="UTF-8"?>
<tasksettings>
<period>10</period>
<logsql>0</logsql>
<tasks>

    <!-- maintenir hors ligne (sb4=1) tous les docs sous copyright -->
    <task active="1" name="confidentiel" action="update" sbas_id="1">
    <from>
        <date direction="before" field="FIN_COPYRIGHT"/>
    </from>
    <to>
        <status mask="x1xxxx"/>
    </to>
    </task>

    <!-- mettre en ligne (sb4=0) les docs de la collection 'public' entre la date de copyright et la date d'archivage -->
    <task active="1" name="visible" action="update" sbas_id="1">
    <from>
        <coll compare="=" id="5"/>
        <date direction="after" field="FIN_COPYRIGHT"/>
        <date direction="before" field="ARCHIVAGE"/>
    </from>
    <to>
        <status mask="x0xxxx"/>
    </to>
    </task>

    <!-- avertir 10j avant l'archivage (lever sb5) -->
    <task active="1" name="bientôt la fin" action="update" sbas_id="1">
    <from>
        <coll compare="=" id="5"/>
        <date direction="after" field="ARCHIVAGE" delta="-10"/>
    </from>
    <to>
        <status mask="1xxxxx"/>
    </to>
    </task>

    <!-- déplacer dans la collection 'archive' -->
    <task active="1" name="archivage" action="update" sbas_id="1">
    <from>
        <coll compare="=" id="5"/>
        <date direction="after" field="ARCHIVAGE" />
    </from>
    <to>
        <status mask="00xxxx"/>  <!-- on nettoie les status pour la forme -->
        <coll id="666" />
    </to>
    </task>

    <!-- purger la collection 'archive' des docs archivés depuis 1 an -->
    <task active="1" name="archivage" action="delete" sbas_id="1">
    <from>
        <coll compare="=" id="666"/>
        <date direction="after" field="ARCHIVAGE" delta="+365" />
    </from>
    </task>

</tasks>
</tasksettings>

Avertissement

Dans le cas de conflits ou de recouvrements entre les critères de <task> successives, des docs peuvent ‘sauter’ d’un état à l’autre à chaque éxécution de la tâche.

ex : dans le cas précédent, si la date d’archivage d’un document est antérieure à sa date de fin de copyright (incohérent), le sb 4 va passer de 0 à 1 à chaque éxécution.

Ce type de problème peut être évité en s’assurant qu’aucune des clauses ‘from’ ne se recouvrent, par ex. en levant un sb spécifique à chaque <task>

API Webhook

Cette tache permet d’exploiter les événements listés dans la table api_webhooks de l’application box. Le paramétrage proposé consiste à indiquer la périodicité d’exploitation de la tâche.