mardi 4 décembre 2007

Moteurs d'indexation (suite)

Pour faire suite à mon billet du 22 novembre dernier, je suis tombé hier sur un article publié dans la revue KmWorld d'août 2007 intitulé "Taking control of the e-discovery process" .

On parle ici de l'utilisation de certaines technologies d'indexation pour préparer une production documentaire, mais aussi pour étudier la production de la partie adverse. Au fond, ce qui n'est pas si bête, en autant que le format des documents électroniques puissent être indexables (ex: image .tif), sans quoi il faudra songer à un tiers logiciel (ex: Acrobat Capture) pour rendre ces documents indexables par l'entremise d'une reconnaissance de texte (OCR).

Je ne veux pas m'entretenir plus longtemps au sujet de la production documentaire en elle-même, mais seulement revenir sur le fait qu'une bonne technologie d'indexation pourra servir potentiellement à plusieurs usages:

1) Offrir un moteur de recherche à vos recherchistes (ou pour tous vos utilisateurs) sur le contenu non-structuré dans votre organisation (ex: répertoires partagés);
2) Devenir une composante à intégrer à votre système de gestion des connaissances pour indexer vos documents (si vous pouvez déterminer le moteur d'indexation pour votre système);
3) Aider à la production ou à l'étude d'une production documentaire dans le cadre d'un litige.

Toutefois, pour l'intégration d'un moteur comme composante à un autre système, il faudra s'assurer que la technologie d'indexation est disponible aussi en version SDK.

Il y a un avantage à cela, chacun des moteurs ne fonctionne pas de la même façon et les utilisateurs doivent savoir les maîtriser tous (en plus de ceux q'on retrouve dans les outils payant comme QL). Par exemple, si dans vos divers projets, les mêmes opérateurs avancés de recherche sont disponibles, via une même technologie, ça me semble un plus pour tout le monde. Cela représente aussi une façon de rentabiliser vos achats informatiques en favorisant l'emploi d'une seule technologie. Parce qu'un moteur d'indexation, c'est un moteur d'indexation, que l'on traite de documents électroniques pour un projet de GS ou pour l'aide à étude d'une production documentaire.

PS: Évidement, à en lire l'article en question on pourrait, avec de tels outils, faire des productions documentaires sans avoir à revoir les documents du tout...bien sûr, bien sûr...mais c'est à vos risques...Encore une fois, la meilleure suggestion qu'on puisse donner est de ne pas confondre technologie et magie ...

Aucun commentaire: