GED : interopérabilité des outils et des données

GED : interopérabilité des outils et des données

Le déploiement d’une GED peut être limité par l’absence de collaboration entre le logiciel de Gestion Electronique des Documents et les autres systèmes déjà en place, ou à venir, dans l’écosystème informatique de l’organisation. Les API permettent l’interopérabilité de ces systèmes hétérogènes et, à un degré plus fin encore, l’interopérabilité de leurs données.

Des API pour l’interopérabilité des outils

Fonctionnalité d’une API

La principale fonctionnalité d’une API (acronyme pour Applicative programming interface ou Interface de Programmation Applicative) est d’exposer et de consommer les données grâce à un langage de programmation standardisé qui permet aux applications logicielles de communiquer et d’échanger des contenus quel que soit le langage de programmation initial.

Le fonctionnement des API repose sur un accord d’entrées et de sorties : le logiciel source reçoit une requête (query) émanant d’un système tiers, qu’il interprète et valide, sous réserve d’autorisation, en donnant accès aux contenus demandés.

Le recours aux API est le moyen d’interfacer le plus souple car la seule condition indispensable est que chaque système dispose d’une API.

Deux modèles de liaison entre API

SOAP (Simple object acess protocol)

S’agissant d’un protocole, il intègre donc des standards de conformité liés à la sécurité, l’atomicité, la cohérence, l’isolement et la durabilité, des propriétés indispensables à la fiabilité des transactions de base.

Tous les messages émanant d’une API SOAP se présentent sous la forme d’un document XML et elle reçoit ses requêtes via HTTP ou SMTP.

L’inconvénient de cette solution est l’obligation de s’adapter à chaque nouvelle version des applications qu’elle interface.

REST (Representational state transfer) ou RESTful

Ni protocole, ni norme, l’API REST est un style d’architecture regroupant six principes directeurs définis par Roy Fielding [1] dont le principal est l’interface uniforme.
Les requêtes avec l’API REST sont gérées via HTTP et parce que cette solution est plus flexible, elle est la plus utilisée par les développeurs notamment pour créer des services web.

[1] Architectural styles and the design of network-based software architectures, thèse de doctorat, Université de Californie, 2000

 

Les API au service de l’interopérabilité de la GED

Développer et déployer des API rend possible l’interopérabilité de la GED d’une organisation en permettant aux systèmes et programmes utilisés dans les différents services et métiers de collaborer avec le logiciel de Gestion Électronique des Documents indépendamment de la compatibilité de leur langage de programmation respectif.

GED interoperabilite des donnees

Icons made by Freepik from www.flaticon.com

Rendre les données interopérables

Avantages de l’interopérabilité des données

Une fois les documents versés dans la GED et accessibles, l’étape suivante consiste à affiner la recherche de contenu afin de simplifier le travail des collaborateurs en leur permettant de trouver une information issue d’un autre outil sans devoir passer en revue l’intégralité du document où elle est contenue.

 

L’interopérabilité ne s’envisage donc pas seulement sur le plan des outils mais également des données qui doivent être accessibles instantanément à tout autre outil métier du Système Informatique (SI) que celui dont elles sont extraites.

Enrichissement des données et indexation

Afin d’obtenir un tel degré de précision, des métadonnées sont ajoutées aux données versées dans la GED afin de qualifier le document avec des informations essentielles :

  • le titre,
  • l’auteur,
  • la langue,
  • la description,
  • la date de création,
  • la date d’envoi en validation
  • et autres informations en fonction du secteur d’activité.

Ces métadonnées sont utilisées par les filtres ou les axes analytiques pour obtenir le niveau de détail, ou granularité de la donnée, le plus fin dans l’analyse des données.

Ce processus d’indexation rend accessible l’information la plus appropriée et la plus actuelle, instantanément et facilement aux métiers selon leurs besoins.

Désormais, il ne s’agit plus seulement de gérer des fichiers, la gestion des données devient un enjeu majeur de la GED.

Automatiser les processus d’indexation

Les technologies traditionnelles de LAD / OCR / RAD sont aujourd’hui concurrencées par l’IA (Intelligence Artificielle) qui ne s’appuie plus sur des modèles préalablement définis mais sur des méthodes d’échantillonnage auto-apprenantes.

GED - IA

Image Rick Byrne – Dribble

L’indexation par RPA (Robotic Process Automation) repose sur un robot logiciel capable de croiser les référentiels de données entre eux.

RPA indexationImage : The Big Data Processing Bot par Minami – Dribble

L’intelligence humaine (IH) intervient en dernier lieu pour compléter manuellement ce que les robots n’ont pas été capables de trouver.

GED intelligence humaine - IH

Image : Abeena Lijo – Dribble

Mobiliser les données grâce à la LAD

La Lecture Automatique de Documents (LAD) regroupe trois technologies principales qui permettent d’exploiter toujours plus avant les data en transformant les informations extraites en métadonnées, ce qui simplifie les requêtes dans le moteur de recherche.

RAD (Reconnaissance Automatique de Documents)

Cette technologie est capable de reconnaître la nature du document numérisé (facture, devis, contrat) à partir de sa mise en page et selon des modèles prédéfinis. Elle extrait des informations qui serviront de métadonnées descriptives. Les index ainsi constitués permettent un classement automatique dans la GED.

Associée à un module OCR, la RAD peut aussi s’appuyer sur l’indexation du contenu qu’elle croise avec le thésaurus de mots-clés.

OCR (Reconnaissance Optique de Caractères)

Cette fonctionnalité est adaptée aux documents non structurés. Elle lit et analyse le texte d’un document numérique pour le transformer en version informatique au format d’un fichier texte et déterminer les mots-clés pour une recherche en full text sur le contenu et pas seulement dans les index.

ICR (Reconnaissance Intelligente de Caractères) fonctionne sur le même principe que l’OCR mais elle est destinée à la reconnaissance des documents manuscrits (lettres ou chèques par exemple).

 

 

Vous souhaitez améliorer votre offre de valeur ?