Alors que nos clients poursuivent leur parcours de transformation numérique, les défis des solutions traditionnelles de capture de documents sont à l'avant-garde. La gestion et la configuration des ensembles d'échantillons de classification et des règles d'extraction dans des solutions héritées basées sur la mise en page sont longues et coûteuses. Les entreprises numériques modernes ont besoin de systèmes qui peuvent continuer à fournir des résultats précis à mesure que les formulaires et les entreprises évoluent. Les solutions existantes ne peuvent pas s'adapter automatiquement à des changements mineurs nécessitant le développement d'applications ou une intervention d'ingénierie pour la reconfiguration.

Traitement des documents IBM Automation

La plupart des solutions d'IA sont soit étroitement ciblées sur un type de document (comme les cartes d'identité, les factures ou les étiquettes d'expédition), soit nécessitent un effort de développement important pour relier les modèles, le référentiel et l'interface utilisateur. IBM ouvre la voie avec une nouvelle solution entièrement intégrée, déployée n'importe où, basée sur la configuration.

La nouvelle capacité de traitement de documents pour IBM Cloud Pak for Automation est une nouvelle façon de penser la capture de documents et la vérification des données.

     Classification des documents

Historiquement, il a été difficile, long et coûteux d'obtenir la vision d'une classification automatisée précise. Les approches traditionnelles exigeaient une mise en page de forme fixe, des mots-clés fixes, des codes-barres / codes correctifs ou une correspondance générale de texte. Ces types d'outils sont extrêmement sensibles à l'évolution des sources et des structures des documents. En pensant à ce package de prêt, les déclarations de revenus et les W2 sont des formulaires standard avec des mises en page standard qui changent rarement.

Une solution de capture traditionnelle peut être formée pour reconnaître la mise en page, mais même un changement mineur d'une année à l'autre pourrait briser ce modèle de classification. Avec les modèles d'apprentissage automatique intégrés dans IBM Automation Document Processing, votre modèle de classification sera plus résistant aux modifications mineures de la mise en page du formulaire. Non seulement il est pré-formé sur les types de documents courants, mais le nouveau produit permet à un utilisateur professionnel d'étendre facilement la formation à l'aide d'ensembles d'échantillons personnalisés.

   Extraction de données

Alors que les technologies de reconnaissance de texte ont continué d'évoluer et de s'améliorer, les technologies de capture traditionnelles n'ont pas progressé dans leur capacité à donner un sens à ce texte. La dépendance continue sur l'extraction de formulaires structurés et les hypothèses sur la mise en page de chaque document pose des problèmes similaires à mon exemple de classification précédent. Cependant, certains types de documents, comme la note elle-même dans notre exemple de prêt, peuvent avoir des mises en page incohérentes. Les pièces justificatives telles que les relevés bancaires, les relevés de paie et les divulgations varient considérablement au sein d'un même programme de prêt. Avec ces types de documents, nous pouvons ne pas savoir où une information peut apparaître, ou même si elle est présente. Néanmoins, nous voulons simplement extraire les bonnes informations si nous les trouvons. Les nouveaux outils d'IBM sont fournis avec des modèles d'apprentissage en profondeur pré-formés conçus pour trouver facilement des centaines de paires clé-valeur communes. Dans l'assistant de configuration de modèle, un analyste commercial peut ajouter plus de champs et, avec un petit ensemble d'échantillons, entraîner le système à les extraire également.

Une solution intégrée Cloud Pak for Automation

IBM a intégré cette solution dans la plate-forme Cloud Pak for Automation via le concepteur low-code de Business Automation Studio. Avec IBM Automation Document Processing, vous disposez d'un assistant simple et convivial pour les analystes métier qui vous guide tout au long de la formation des modèles de classification et d'extraction. L'assistant permet à l'utilisateur de définir des règles de validation des données (dates, numéros de téléphone, niveaux de confiance) et mappe simultanément cette configuration dans des classes de documents et des modèles de propriétés nouveaux ou existants dans un référentiel IBM FileNet Content Manager. Ces outils low-code permettent à ce même analyste métier de concevoir, tester et déployer une expérience utilisateur intuitive pour valider les résultats de classification et d'extraction en temps réel. Cette intégration signifie également que ces fonctionnalités peuvent être utilisées directement à partir d'un cas ou d'une solution de flux de travail.

Les capacités d'IBM Automation Document Processing fournissent au système les données nécessaires pour:

  • Vérifier automatiquement que le demandeur a correctement saisi ses revenus sur la demande.
  • Vérifiez que le montant du prêt demandé est inférieur à la limite absolue pour ce niveau de revenu.
  • Vérifiez immédiatement le rapport de solvabilité du demandeur.
  • Demander automatiquement plus d'informations au demandeur

Une fois le prêt approuvé, le système peut également déterminer si la note exécutée:

  • Est étiquetée avec le bon numéro de prêt.
  • A toutes les bonnes cases cochées.

Chacune de ces tâches peut être accomplie sans intervention humaine.

 

Illustration Freepick : <a href="https://fr.freepik.com/photos-vecteurs-libre/nuage">Nuage vecteur créé par macrovector - fr.freepik.com</a>