samedi 24 novembre 2007

Mise en ligne du catalogue de la bibliothèque Prince Rupert Public Library

Le 5 novembre dernier, la bibliothèque "Prince Rupert Public Library" de la Colombie-Britannique annonçait la mise en ligne de son catalogue avec le logiciel Open Source Evergreen. Cet ouverture constitue un pilote, les bibliothèques publiques de la Colombie-Britannique ayant adopté un plan sur cinq ans pour l'implantation progressive de cette solution dans tout leur réseau.

jeudi 22 novembre 2007

L'indexation plein texte des documents

Je vais entreprendre dans ce billet une petite analyse d'un sujet qui n'est pas simple en soi, mais qu'il faut bien tenter de démêler... Au fur et à mesure que je pourrai approfondir le sujet, j'irai apporter quelques ajouts et modifications à ce texte. Aussi, vos commentaires seraient fortement appréciés .Voici mes découvertes à ce jour:

Il existe divers types de moteurs d'indexation ayant pour but de vous permettre de chercher dans le corps de vos documents:

1) D'abord celui qui est inclut dans le système d'exploitation Windows;
2) Les deskstops;
3) Les composantes d'indexation fournies avec les systèmes de gestion documentaire;
4) Les systèmes d'indexation pour entreprise.

1) Le moteur d'indexation inclut dans votre système d'exploitation Windows

Cliquez sur le bouton droite de la souris lorsque vous êtes sur un répertoire, normalement vous devriez y trouver une fonction recherche, et plus particulièment, une fonction de recherche dans le plein texte. Cette recherche est généralement peu performante et offre peu de capacité, c'est pourquoi il existe d'autres outils plus sophistiqués, bien que Windows ai apporté certaines améliorations à ce niveau avec son dernier système d'exploitation Vista.

2) Les deskstops;

Voici trois grands acteurs dans ce domaine:

-Google Desktop;
-Exalead Desktop;
-Copernic Desktop

Premier constat, ils sont tous gratuits. Deuxième constat, il semble bien aujourd'hui que GoogleDesktop pose certains problèmes de sécurité. Il est crucial évidemment de lire les Règles de Confidentialité de Google Desktop avant d'entreprendre son installation, particulièrement si on envisage son utilisation dans un contexte professionnel. Pour ces raisons, nous n'iront pas plus loin avec cette option.

Copernic Desktop est un outil tout simplement remarquable quant à sa vitesse d'indexation, sa recherche, ses nombreuses possibilités et il semble assurer une meilleure protection au niveau de la sécurité. D'ailleurs, ce petit outil de chez nous, est reconnu parmi les meilleurs si l'on en croit certaine étude sur le sujet. Il permet d'indexer votre boîte Outlook, offre la surbrillance dans les documents et peut également indexer les répertoires dont vous avez accès via votre machine de la façon suivante:

Outils>Options>Fichiers:

















L'inconvénient est que ce type d'approche nécessite une installation et un paramétrage par poste. Pour une moyenne organisation, cela ne sera pas l'idéal. Il faudra donc chercher des solutions un peu plus loin.

3) Les composantes d'indexation fournies avec votre système de gestion documentaire (GD);

Bien sûr si vous travaillez dans une grande organisation, il y a de bonnes chances que vous soyez déjà muni d'un indexeur de documents par l'entremise de votre système de gestion documentaire interne. Cela étant, il faudra bien que les documents soient archivés dans le système en question pour les retrouver et non sur le poste des employés...

Le logiciel souvent rencontré en milieu juridique est Hummingbird racheté récemment par la compagnie OpenText. Ce type d'outil est souvent une grosse quincaillerie qui doit être bien paramétré avec budget à l'appui pour consultant et tout...Le problème, à mon humble avis, avec les grands noms de l'industrie, est le fait que leurs contrôles passent d'une main à l'autre, et il devient diffiçile de suivre ou influencer l'évolution de l'outil. Mais habituellement, ce type de système offre une excellente indexation plein texte avec de bons opérateurs de recherche. Ces systèmes par contre, deviendront rapidement un entrepôt de documents trop grand pour offrir une recherche efficace pour vos utilisateurs dans l'esprit d'un projet de gestion des connaissances.

Sans trop déborder de mon sujet initial, il existe aujourd'hui quelques très bons outils de GD conçus par des firmes de plus petites tailles mais stables et crédibles. Il existe aussi quelques systèmes complets en Open Source. Bref, la clé du succès repose essentiellement sur le service et le soutien que vous pourrez obtenir. Sans aller plus loin, ce volet ne peut être étudié qu'en surface ici pour l'instant étant donné qu'il s'agit d'un sujet vaste...

4) Les systèmes d'indexation pour l'entreprise

Il existe plusieurs moteurs d'indexation payant, qui sont parfois intégrés comme une composante à un système de gestion documentaire. D'autres fois, ils sont utilisés seuls pour indexer votre contenu d'entreprise sans le soutien d'une basé de données. Pour n'en nommer que quelques-uns:

-Vivisimo
-Google enterprise
-Autonomy (anciennement Verity mais racheté par Autonomy...)
-Isys
-Recommind
-Sinequa

Encore une fois, le but ici n'est pas de faire une étude exhaustive de ces différents produits. Le coût pour l'achat et l'installation de tel produit est un facteur à considérer...et il existe différentes approches pour facturer le client (par année, nombre de documents, par licence...).

Un conseil ici, tant qu'à débourser des sommes importantes pour l'achat de ce type de technologie, aussi bien s'assurer que les 5 points suivants sont bien adressés:

1) Indexation de tous les types de document;
2) Disponibilité d'opérateur avancé de recherche tel que NEAR (et non seulement AND, OR, NOT, "expression");
3) Surbrillance pour tous les types de document via un filtre htlm;
4) Possibilité d'affiner une recherche (chercher dans une liste de résultat préconstituée)
5) Notification sur recherche

Par contre, on commence à voir apparaître d'autres moteurs d'indexation gratuit qui peuvent être très intéressants pour une petite ou moyenne entreprise. Bien sûr, il faudra prévoir une installation et un paramétrage puisque le tout devra être installé au niveau du serveur, mais en terme de coût de revient, cette option pourrait bien s'avérer très intéressante:

1) Omnifind...IBM et Yahoo

J'ai installé cette version gratuite, et j'ai monté une petite interface de recherche qui se présente comme une simple page web accessible à partir de plusieurs postes...ouf...ça ouvre bien des possibilités. Voici l'interface de recherche que j'ai préparée dans un format très simple à la Google ou yahoo:

















Vous pouvez lire aussi le billet suivant sur ce sujet auquel je partage les commentaires. Cet outil est limité à 500 000 documents...mais il y a là tout de même une bonne marge de manoeuvre.

Avec un peu d'imagination, si vous avez des bureaux situés dans différentes régions , il me semble bien qu'il y a quelques choses à faire...

2) Microsoft Search Server Express:

Suivant un modèle semblable, Microsoft a annoncé récemment qu'il préparait sa contre-offre gratuite pour occuper sa part du marché...Son produit est actuellement disponible en version Beta, et promet d'être très intéressant aussi :

-Alerte courriel ou RSS sur recherche
-Sans limite concernant le nombre de documents.

On reconnaît un sharepoint allégé.

Il faut espérer que la concurrence puisse continuer à bien nous servir de cette façon...

En terminant, un système d'indexation de documents n'est pas une solution de gestion des connaissances en soi. Il ne peut être considéré qu'en tant que composante à un projet de gestion des connaissances.

Bien sûr, je présente les choses ici en présumant, comme c'est souvent le cas , qu'il faut travailler avec un budget très restreint (ce qui rend plus difficile la chose et demande un peu plus d'imagination...), mais le mieux reste de songer à un produit spécialisé couplant base de données ET un indexeur plein texte. Peut-être prévoir un peu plus de ressources et envisager ce projet davantage comme un investissement.

Nous y reviendrons...

dimanche 18 novembre 2007

Récupérer les documents de formation

Bien entendu, il arrive que les employés reçoivent de la formation à l'externe. Évidement, les documents qui y sont distribués peuvent s'avérer utiles à conserver et partager avec les autres membres de l'organisation. Pourquoi ne pas les archiver et les classifier dans votre système de gestion des connaissances?

Pour se faire, le plus simple est d'exiger à votre personnel, qui ira suivre la formation, de demander directement à l'auteur la possibilité d'obtenir une copie électronique du document de formation avec une autorisation de publier dans votre système interne.

Par contre, dans les faits, il y a bien des chances que cette petite exigence soit difficile à faire respecter.

Peut-être plutôt proposer que la personne en charge du projet de GS, ou son équipe, assume la responsabilité de faire le suivi pour obtenir les documents en question et l'autorisation de publier auprès de l'auteur? Ou peut-être encore faire en sorte que la personne en charge de payer les comptes puisse envoyer un simple formulaire modèle pour demander les documents à l'auteur ainsi que la demande d'autorisation? Bref, il suffit de trouver un moyen pour savoir qui ira, ou est allé, à une formation et ajouter une étape supplémentaire à nos processus actuels pour effectuer ce suivi.

Je me suis amusé à chercher une façon ultra simple de créer une base de donnée pour nous préparer à faire ce suivi. Pour ceux qui ont un soutien informatique limité, j'ai trouvé Zoho Creator qui permet de générer une base de donnée en ligne...: http://www.zoho.com/

Diffiçile de faire plus simple comme outil et c'est gratuit!

Mon projet était de faire un petit outil simple pour ce type de besoin qui présenterait un formulaire web à un employé qui désirerait obtenir l'autorisation de son employeur d'aller à une formation. Les informations du formulaire pourraient par la suite être récupérées pour faire notre suivi mentionné plus haut.

Zoho, permet très simplement de monter des bases de données, entre autre, privées ou public pour différents besoins personnalisés. ATTENTION, il faut savoir et garder à l'esprit que ce type de système conserve vos données sur des serveurs situés à l'externe, mais puisqu'ici on ne parle pas d'information très stratégiques à votre organisation, on peut penser que cette façon de faire sera sans danger apparent.

1) Cliquez sur l'image ci-dessous pour voir mon formulaire:


2) Après que l'employé ai rempli un formulaire de demande, l'administrateur du projet peut même être notifié par courriel de la façon suivante:


Il existe également un petit tutoriel sur ce module.

À vous de voir comment coller ses idées à vos processus déjà en place.





jeudi 15 novembre 2007

www.infojuridique.ca

Voici un site juridique intéressant, que je viens de découvrir, et qui propose des capsules vidéos sur divers sujets courant en droit:

http://www.infojuridique.ca/

Des capsules riches en information, une présentation particulièrement efficace et simple d'utilisation pour tous. Une belle intégration de la vidéo de formation dans un site web.

Bref une belle réalisation à mettre dans ces favoris! à suivre...

En passant, concernant la formation en ligne, on retrouve dans le site de l'Association du Barreau Canadien Section Québec la possibilité d'acheter de la formation vidéo pour les juristes. Aussi maintenant vous trouverez une section "Cyberformation" dans le site du Barreau du Québec.

vendredi 9 novembre 2007

Distribuer ou diffuser?

L'utilisation du courriel est devenu problématique à plusieurs niveaux. Tout est en place pour être déranger sans cesse dans notre concentration avec, entre autre, la petite fenêtre Outlook, nous avisant qu'un courriel, peut-être important, vient d'entrer dans notre boîte. Il suffit d'un clique pour répondre, plus le temps d'y réfléchir! Plusieurs études démontrent aujourd'hui l'inefficacité de l'utilisation que l'on fait de cette technologie et il y aurait même des risques au niveau de la santé des individus...(selon une étude récente,1 personne sur 3, se dit souffrir du "stress du courriel"...28% des personnes sondées se disent "dirigées" par leur courriel et par la nécessité de répondre le plus rapidement possible...)

Il faut remettre de l'ordre dans tout ça... Proposer une directive simple pour clarifier ce qui, en terme d'information, devrait être diffusée sur l'intranet, ce qui devrait plutôt être diffusée via le système de gestion des connaissances et ce qui devrait faire l'objet d'une distribution par courriel. Les employés doivent savoir ou se trouve l'information dans l'organisation et pour cela, il faut indiquer et rappeler à quoi chacun des outils doit servir.

Avant l'air du numérique, quand il y avait une urgence, on plaçait le document sur la chaise de l'employé (Courriel-distribution). Si l'information était d'un intérêt général, on l'a partageait sur le babillard (diffusion). Si l'information était d'intérêt spécifique, mais non urgente, elle était placée dans le pigeonnier. Au fond ce n'était peut-être pas si bête...et c'est une bonne piste de réflexion pour établir et mettre en place une directive quant à l'utilisation des technologies. Avec le flot d'information qui transite maintenant, il faut à mon avis adopter une directive pour le bénéfice de tous.

mercredi 7 novembre 2007

Archiver des livres juridiques libres de droit d'auteur

Il semblerait que Microsoft, qui veut probablement faire compétition à Google, offre maintenant via son interface Live, un accès complet à de vieux ouvrages numérisés (traitant de plusieurs domaines y compris juridique canadien) et qui seraient aujourd'hui libres de droit.

La beauté de ce projet réside dans le fait que les documents sont accessibles en entier et en format PDF... Si vous êtes intéressé par cette idée, vous devez également consulter le projet d'envergure qu'est: Internet Archive, section Text (PDF)

voir aussi: Le projet Alouette (non PDF)
La bibliothèque Nationale section Collection numérique

Pourquoi ne pas archiver, ou créer des liens, sur les ouvrages juridiques d'intérêt en format PDF, à l'intérieur de votre propre projet, de façon à ce que les documents puissent être pleinement indexés? Peut-être même créer une section "documents de nature historique"...

Je vous laisse découvrir par vous même ce qu'on peut trouver dans ces différents projets (exemple de mots clés: canada constitution, canada law....)