Project

General

Profile

Actions

Feature #1702

closed

Ne pas indexer séparément les fichiers joints

Added by Nicolas Eysseric almost 11 years ago. Updated over 10 years ago.

Status:
Closed
Priority:
Normal
Category:
Fichiers joints
Start date:
03/03/2011
Due date:
% Done:

100%

Estimated time:
Livraison en TEST:
Livraison en PROD:

Description

Actuellement, le contenu des fichiers joints sont indexés deux fois :
  1. Le fichier est indexé et génère un Document (au sens Lucene) à part entière
  2. Le contenu du fichier est indexé au sein du Document (toujours au sens Lucene) associé à la publication (par exemple).

Selon les cas, il est donc possible que le moteur de recherche restitue des fichiers joints directement et/ou les publications qui contiennent ces fichiers.

L'idée de cette évolution est de permettre de ne plus indexer indépendamment les fichiers joints. Ainsi, seules les publications seront affichées par le moteur de recherche.

Actions #1

Updated by David Lesimple almost 11 years ago

Il serait souhaitable que le comportement actuel reste possible par paramétrage plateforme.

Actions #2

Updated by Nicolas Eysseric over 10 years ago

  • Target version set to Version 5.7
Actions #3

Updated by Nicolas Eysseric over 10 years ago

  • Status changed from New to In progress...
  • Assignee set to Nicolas Eysseric
Actions #4

Updated by Nicolas Eysseric over 10 years ago

  • Status changed from In progress... to Closed
  • % Done changed from 0 to 100

En fait, il y a erreur dans l'analyse initiale !
Le contenu des fichiers joints à une publication n'était pas intégré à l'index de la publication.
L'indexation était gérée séparément de la publication. Chaque fichier joint générait son propre index.

La présente évolution permet de paramétrer le comportement de l'indexation des fichiers joints grâce aux paramètres suivants du fichier SILVERPEAS_HOME/properties/com/stratelia/webactiv/util/attachment/Attachment.properties:

attachment.index.separately = true
attachment.index.incorporated = true

attachment.index.separately permet d'activer ou non l'indexation séparée des fichiers joints.
Si le paramètre est égal à true alors les fichiers joints remonteront dans la liste des résultats de recherche.
Sinon, les fichiers ne seront pas indexés séparément et aucun fichier ne remontera dans les résultats.

attachment.index.incorporated permet d'activer ou non l'indexation du contenu des fichiers joints au sein de l'index des publications.
Si le paramètre est égal à true et si le texte recherché est contenu dans un fichier joint à la publication, alors la publication remontera dans la liste des résultats de recherche.

Si les deux paramètres valent false alors le contenu des fichiers joints ne sera tout simplement pas indexé d'une manière ou d'une autre.

Si les deux paramètres valent true et pour un texte recherché présent dans un fichier joint alors la publication ET le fichier joint remonteront dans la liste des résultats.

Si attachment.index.separately = false et attachment.index.incorporated = true alors seules les publications remonteront dans les résultats de recherche. Les fichiers joints ne seront plus présents.

Actions

Also available in: Atom PDF