Gestion documentaire

Indexation de documents et classification

L’indexation est une procédure consistant à associer ou à tagger des documents ou d’autres contenus avec des informations (des métadonnées) permettant par la suite de facilement les rechercher et les récupérer. Si certaines solutions de gestion de documents (GED) indexent uniquement le nom de fichier d’un document, d’autres répertorient le contenu complet ainsi que les métadonnées. Ces dernières, propres à chaque fichier, renseignent par exemple sur l’identité du créateur du document, sa date de création ou de dernière modification, etc. Ces métadonnées peuvent également être complétées manuellement par les utilisateurs et personnalisées selon la typologie du document.

Indexation
Indexation 2

L’indexation est particulièrement importante pour déterminer le classement des résultats de recherche. Par exemple, il est logique qu’un document récemment exploité par un utilisateur remonte avant un autre fichier non ouvert depuis plusieurs semaines. Le classement peut également être influencé par la proximité de deux mots-clés de recherche dans le document, celle-ci optimisant alors la position du classement à mesure que les mots-clés sont plus proches l’un de l’autre. Il est plutôt recommandé aux organisations qui doivent gérer des volumes de documents importants d’opter pour des solutions dotées de puissantes fonctionnalités de recherche et permettant une indexation fine et personnalisable des documents.

Si les solutions de gestion documentaire donnent aujourd’hui aux utilisateurs la liberté de personnaliser pleinement la classification de leurs contenus, elles intègrent aussi pour la plupart des technologies facilitant la classification automatique des documents et de leurs contenus. L’OCR (Reconnaissance optique des caractères), la LAD (Lecture automatique des documents), la RAD (Reconnaissance automatique des documents), l’intelligence artificielle, l’apprentissage automatique (ou machine learning) et l’apprentissage profond (deep learning) sont ainsi capables d’identifier les types de documents (factures, notes de service, contrats, images, etc.), de les lier entre eux (pièce jointe attachée à un courrier, par exemple) et même d’évaluer leur tonalité. Ces technologies contribuent surtout à indexer correctement les contenus au sein des solutions de gestion documentaire. Il n’est dès lors plus nécessaire de procéder à une classification et une indexation manuelle, celle-ci étant réalisée automatiquement.

Pour une recherche de documents plus efficace

Si la recherche peut fournir des résultats en se basant uniquement sur le contenu d’un document, elle peut aussi donner aux utilisateurs la possibilité d’explorer ses métadonnées. En effet, ces dernières fournissent de précieuses informations sur les fichiers auxquels elles sont rattachées (type de document, date d’expiration, nom du client ou du projet, etc.), ce qui optimise leur remontée dans les moteurs de recherche. Les solutions de gestion documentaire les plus avancées s’appuient donc à la fois sur les métadonnées et sur les contenus pour offrir une pertinence accrue. Elles permettent également le filtrage des résultats en configurant certains paramètres (par date, auteur, type de document, type de fichier, etc.).
Plus il y a de documents et de contenu, plus les capacités d’indexation et de recherche des solutions sont essentielles. L’objectif étant de retrouver immédiatement le document recherché, sans avoir à en éplucher plusieurs dizaines avant de trouver le bon. Certaines solutions offrent des possibilités de recherche qui couvrent plusieurs référentiels, et pas seulement le référentiel de la solution de gestion documentaire elle-même. Elles renvoient, par exemple, des résultats qui incluent des contenus stockés dans des dossiers réseau, d’autres GED mais aussi dans l’ERP, le CRM ou des espaces de stockage cloud tels que DropBox, OneDrive et Google Drive.

Les atouts d'une organisation optimale des documents

Les solutions de gestion documentaire peuvent être classées en deux grandes catégories, selon la façon dont elles stockent et organisent le contenu : les solutions dîtes “traditionnelles” qui s’appuient sur une structure de dossiers hiérarchisée, et les solutions qui tirent parti des métadonnées.

Assurer la traçabilité des documents grâce au records management

En plus de rendre possible une organisation intelligente des documents, les solutions de gestion documentaire sont en capacité de rendre compte des actions effectuées sur les documents : modifications, partages (en interne et en externe), créations de copies, etc. Ces différentes opérations sont détaillées dans des documents dits “d’activité” ou d’autres éléments d’informations, créés tout au long du processus documentaire : accords, procès-verbaux de réunions, dossiers administratifs et juridiques, politiques et règlements d’entreprise, procédures, guides, etc. Ces documents sont essentiels pour attester de la conformité de l’organisation avec les normes de son secteur d’activité et pour assurer la continuité de ses activités.

Mais surtout, ces pièces (ou records) doivent être conservées pour répondre aux exigences légales en vigueur. En effet, au regard du RGPD (Règlement général sur la protection des données), l’organisation est responsable des données qu’elle conserve, elles-mêmes issues de sources diverses, et doit pouvoir fournir à un individu les données qui le concernent et préciser leur utilisation. Il est donc indispensable d’assurer la traçabilité de ces informations et des documents, tout en limitant leur accès.

C’est là tout l’intérêt du records management (ou gestion des documents d’activité), défini par la norme ISO 15 489. Celle-ci précise qu’il s’agit d’une “fonction d’organisation et de gestion de l’ensemble des documents/données, quels que soient leur forme ou leur support, produits ou reçus par toute personne physique ou morale dans l’exercice de ses activités ou de ses obligations légales”. Plus simplement, le records management s’appuie sur les documents d’activité évoqués précédemment (les “records”) pour instaurer un contrôle efficace et systématique de la création, la réception, la maintenance, l’utilisation et la mise à disposition des records (documents d’activité). Il concerne aussi bien le processus de capture que les moyens mis en place pour assurer la conservation des preuves et des informations sur les activités de l’organisation et ses transactions.

En plus de fournir des fonctionnalités de gestion de document telles que l’amélioration de la recherche, de l’organisation et de l’automatisation de workflow, certaines solutions offrent également des capacités de records management, notamment une gestion du cycle de vie complet des documents, avec capture et classification des enregistrements, application des périodes de conservation des dossiers, e-discovery, gestion de la destruction des documents, traçabilité et pistes d’audit.

Le records management contribue ainsi à accroître la productivité de l’organisation en assurant la disponibilité des informations au sein des solutions de gestion documentaire. Il fournit également de précieuses indications quant à la conservation des documents (toujours en adéquation avec les exigences du RGPD), telles que la durée de conservation ou le sort final (destruction, anonymisation, archivage). L’objectif étant, bien sûr, de pouvoir se protéger en cas de contentieux et d’éviter les risques documentaires.