EXTRACTTEXT

Aperçu

L’application de workflow EXTRACTTEXT extrait le contenu texte d’un fichier en entrée (.pdf, .docx ou .txt) et retourne le texte extrait ainsi que sa longueur. Elle prend en charge des paramètres optionnels pour la taille maximale du fichier, le découpage et la normalisation du texte (sauts de ligne au format Unix).

Paramètres requis

Paramètre
Type
Direction
Description

FILE

FILE

IN

Le fichier à partir duquel extraire le texte (doit être au format .pdf, .docx ou .txt)

TEXT

TEXT

OUT

Le texte extrait (pouvant être normalisé ou découpé)

LENGTH

NUMERIC

OUT

La longueur (nombre de caractères) du texte extrait

Paramètres facultatifs

Paramètre
Type
Direction
Description

MAX_FILE_SIZE

NUMERIC

IN

Taille maximale autorisée du fichier, en Mo

TRIM_SIZE

NUMERIC

IN

Nombre maximal de caractères à conserver du texte extrait

NORMALIZE

TEXT

IN

Indique s’il faut normaliser les fins de ligne Valeurs possibles :

  • Y

  • N

  • true

  • false

Mis à jour