Projet

Général

Profil

Actions

Feature #6811

fermé

Modification de l'indexation et du moteur de recherche

Ajouté par Umar Raad il y a plus de 8 ans. Mis à jour il y a environ 5 ans.

Statut:
Closed
Priorité:
Normal
Assigné à:
-
Catégorie:
-
Version cible:
-
Début:
02/09/2015
Echéance:
% réalisé:

100%

Temps estimé:
Livraison en TEST:
Livraison en PROD:

Description

Bonjour,

La proposition suivante n'est que, comme déjà indiqué, une proposition. Elle se base sur les problèmes que nous avions rencontré à l'époque de DSR avec le moteur de recherche.

Explication du problème:

Nous utilisions un grand nombre de GED sur lequel les droits sur les dossiers étaient activés.

Sachant que la recherche analyse dans un premier temps les informations d'indexation PUIS parse tous les dossiers (ce qui est long) afin de savoir si les droits des utilisateurs leur permettent de voir le document trouvé, les temps de recherche étaient très lents (de l'ordre de 40 secondes ou plus). Ce même délais apparaissait lorsqu'on ouvrait la recherche avancée (A cause du comptage de publication variable suivant les droits)

Solution proposée

Idéalement il faudrait intégrer les droits sur les publications/dossiers des GED dans l'indexation de la plateforme et n'effectuer les recherches QUE sur les résultats de l'indexation.
Ceci implique aussi le fait de conserver le delta des changements de droits dans un "buffer" qui peut aussi être lu par le moteur de recherche afin que les résultats reste cohérents entre deux indexations.

Sauf erreur de ma part, une grande part des autres solutions de CMS utilisent un procédé similaire.

Je me rends bien sûr compte que c'est un gros travail qui en plus n'est pas visible au premier coup d’oeil, mais comme vous êtes en plein dans un processus de remise à plat des fondamentaux de SP je pense que ça vaut la peine de garder ceci dans un coin de votre esprit.

Cordialement,

Umar

Mis à jour par Nicolas Eysseric il y a environ 5 ans

  • Statut changé de New à Closed
  • % réalisé changé de 0 à 100

Depuis la version 6, les temps de recherche ont été très grandement améliorés grâce à plusieurs efforts : index unique par application (et non plus par instance d'application), optimisations sur la vérification des droits, optimisations sur la restitution des résultats...

Mis à jour par Nicolas Eysseric il y a environ 5 ans

J'ai également oublié le changement de version de Lucene (passage de la version 3 à la version 7).
Pour des grosses plate-formes, nous avons constaté des temps pour une recherche passés de 2 minutes à 10 secondes pour 10.000 résultats retournés.

Actions

Formats disponibles : Atom PDF