Projet

Général

Profil

Actions

Feature #1702

fermé

Ne pas indexer séparément les fichiers joints

Ajouté par Nicolas Eysseric il y a environ 13 ans. Mis à jour il y a plus de 12 ans.

Statut:
Closed
Priorité:
Normal
Assigné à:
Catégorie:
Fichiers joints
Début:
03/03/2011
Echéance:
% réalisé:

100%

Temps estimé:
Livraison en TEST:
Livraison en PROD:

Description

Actuellement, le contenu des fichiers joints sont indexés deux fois :
  1. Le fichier est indexé et génère un Document (au sens Lucene) à part entière
  2. Le contenu du fichier est indexé au sein du Document (toujours au sens Lucene) associé à la publication (par exemple).

Selon les cas, il est donc possible que le moteur de recherche restitue des fichiers joints directement et/ou les publications qui contiennent ces fichiers.

L'idée de cette évolution est de permettre de ne plus indexer indépendamment les fichiers joints. Ainsi, seules les publications seront affichées par le moteur de recherche.

Mis à jour par David Lesimple il y a environ 13 ans

Il serait souhaitable que le comportement actuel reste possible par paramétrage plateforme.

Mis à jour par Nicolas Eysseric il y a presque 13 ans

  • Version cible mis à Version 5.7

Mis à jour par Nicolas Eysseric il y a plus de 12 ans

  • Statut changé de New à In progress...
  • Assigné à mis à Nicolas Eysseric

Mis à jour par Nicolas Eysseric il y a plus de 12 ans

  • Statut changé de In progress... à Closed
  • % réalisé changé de 0 à 100

En fait, il y a erreur dans l'analyse initiale !
Le contenu des fichiers joints à une publication n'était pas intégré à l'index de la publication.
L'indexation était gérée séparément de la publication. Chaque fichier joint générait son propre index.

La présente évolution permet de paramétrer le comportement de l'indexation des fichiers joints grâce aux paramètres suivants du fichier SILVERPEAS_HOME/properties/com/stratelia/webactiv/util/attachment/Attachment.properties:

attachment.index.separately = true
attachment.index.incorporated = true

attachment.index.separately permet d'activer ou non l'indexation séparée des fichiers joints.
Si le paramètre est égal à true alors les fichiers joints remonteront dans la liste des résultats de recherche.
Sinon, les fichiers ne seront pas indexés séparément et aucun fichier ne remontera dans les résultats.

attachment.index.incorporated permet d'activer ou non l'indexation du contenu des fichiers joints au sein de l'index des publications.
Si le paramètre est égal à true et si le texte recherché est contenu dans un fichier joint à la publication, alors la publication remontera dans la liste des résultats de recherche.

Si les deux paramètres valent false alors le contenu des fichiers joints ne sera tout simplement pas indexé d'une manière ou d'une autre.

Si les deux paramètres valent true et pour un texte recherché présent dans un fichier joint alors la publication ET le fichier joint remonteront dans la liste des résultats.

Si attachment.index.separately = false et attachment.index.incorporated = true alors seules les publications remonteront dans les résultats de recherche. Les fichiers joints ne seront plus présents.

Actions

Formats disponibles : Atom PDF