Projet

Général

Profil

Actions

Support #8040

fermé

Publication-MS Office -Métadonnées et indexation

Ajouté par Marc Avenel il y a plus de 8 ans. Mis à jour il y a environ 8 ans.

Statut:
Closed
Priorité:
Normal
Assigné à:
Catégorie:
Publication
Version cible:
-
Début:
16/06/2016
Echéance:
% réalisé:

100%

Temps estimé:
Navigateur:
Firefox
Votre version de Silverpeas:
5.15.3
Système d'exploitation:
Livraison en TEST:
Livraison en PROD:

Description

Gestion des métadonnées liées aux propriétés des fichiers issues de MS Office.
Si nous prenons un fichier Word
> Nous avons le contenu
> Propriétés du document
Les propriétés du document permettent de définir des attributs qui contiennent des données métier.

Lors que ce document est stocké dans Silverpeas comment est-il indexé dans Lucene:
> Contenu : Indexation full text
> propriétés : stockées dans la base de données ou full text

Les propriétés du document Word sont-elles traitées comme dans la publication pour les informations suivantes
>titre, description, mots clef

Merci de vos précisions sur ce sujet


Fichiers

Word-Publi-META.png (37,1 ko) Word-Publi-META.png Marc Avenel, 16/06/2016 11:30

Mis à jour par Marc Avenel il y a plus de 8 ans

J'ai contrôlé la gestion des propriétés des documents MS Office (voir copie écran)

Drag drop du fichier sans publication: Récupération
> Titre du document dans le Titre de la publication
> Objet du document dans la description de la publication
> Mots clés du document dans mots clés de la publication
> autres propriétés non récupérées

Drag drop du fichier dans une publication
> Aucune récupération

J'ai bien tout compris ?
Merci à vous

Mis à jour par David Lesimple il y a plus de 8 ans

  • Statut changé de New à In progress...
  • Assigné à mis à David Lesimple
  • Priorité changé de High à Normal

Mis à jour par David Lesimple il y a plus de 8 ans

  • Statut changé de In progress... à Feedback

Marc Avenel a écrit :

J'ai contrôlé la gestion des propriétés des documents MS Office (voir copie écran)

Drag drop du fichier sans publication: Récupération

Titre du document dans le Titre de la publication
Objet du document dans la description de la publication
Mots clés du document dans mots clés de la publication
autres propriétés non récupérées

Drag drop du fichier dans une publication

Aucune récupération

J'ai bien tout compris ?
Merci à vous

Dans le 1er cas, les meta-données du fichier sont utilisées pour enrichir l'entête de la publication (titre, description, mots-clés) et donc ces champs sont bien indexés par le moteur de recherche.

Dans le second cas, les meta-données titre et description devraient être récupérées comme titre et description du document dans la publication.

Concernant l'indexation, toutes ces meta-données sont indexés par Lucene.

Mis à jour par Marc Avenel il y a plus de 8 ans

Dans le second cas, vous me dites :
> les meta-données titre et description devraient être récupérées comme titre et description du document dans la publication.

Ce n'est pas le cas,
De plus comment cela peut se faire si on ajoute différentes pièces jointes dans une même publication
> La dernière pièce jointe replacerait les données précédentes.
> Je ne comprends pas

Ces métadonnées de la publication sont bien stockées dans la Tables associée ?
Merci à vous

Mis à jour par David Lesimple il y a plus de 8 ans

Vous n'avez pas bien lu ma réponse ou elle n'est pas claire :

- 1er cas (aucune publication): les meta-données du fichier sont utilisées pour enrichir l'entête de la publication (titre, description, mots-clés) et donc ces champs sont bien indexés par le moteur de recherche.

- 2ème cas (il y a deja une publication et j'effectue le d&d dans cette publication) : les meta-données titre et description devraient être récupérées comme titre et description du document dans la publication. Je dis devrais car cela ne fonctionne pas semble-t-il , le titre et la description ne sont pas répercutés sur le fichier dans la publication.

Mis à jour par David Lesimple il y a plus de 8 ans

Marc Avenel a écrit :

Ces métadonnées de la publication sont bien stockées dans la Tables associée ?

oui.

Mis à jour par Marc Avenel il y a plus de 8 ans

En résumé:
> Quelle est la règle d'intégration des fichiers MS Office qui contiennent des métadonnées?
> Quelle la "Best practice" à ce sujet?
Merci

Mis à jour par David Lesimple il y a plus de 8 ans

Marc Avenel a écrit :

En résumé:

Quelle est la règle d'intégration des fichiers MS Office qui contiennent des métadonnées?

il me semble avoir tout expliqué dans ce ticket:
https://tracker.silverpeas.org/issues/8040#note-5

Quelle la "Best practice" à ce sujet?

Merci

ne pas utiliser le copier/coller de document mais plutot des modèles, car lors des copies, les meta-données sont conservées et au final ne correspondent plus du tout au contenu du fichier !!
Se limiter à quelques méta-données (titre, description).

Mis à jour par David Lesimple il y a environ 8 ans

  • Statut changé de Feedback à Closed
  • % réalisé changé de 0 à 100
Actions

Formats disponibles : Atom PDF