EXTRACTTEXT
Aperçu
L’application de workflow EXTRACTTEXT extrait le contenu texte d’un fichier en entrée (.pdf
, .docx
ou .txt
) et retourne le texte extrait ainsi que sa longueur. Elle prend en charge des paramètres optionnels pour la taille maximale du fichier, le découpage et la normalisation du texte (sauts de ligne au format Unix).
Paramètres requis
FILE
FILE
IN
Le fichier à partir duquel extraire le texte (doit être au format .pdf
, .docx
ou .txt
)
TEXT
TEXT
OUT
Le texte extrait (pouvant être normalisé ou découpé)
LENGTH
NUMERIC
OUT
La longueur (nombre de caractères) du texte extrait
Paramètres facultatifs
MAX_FILE_SIZE
NUMERIC
IN
Taille maximale autorisée du fichier, en Mo
TRIM_SIZE
NUMERIC
IN
Nombre maximal de caractères à conserver du texte extrait
NORMALIZE
TEXT
IN
Indique s’il faut normaliser les fins de ligne Valeurs possibles :
Y
N
true
false
Mis à jour