Depuis SharePoint 2010 vous avez la possibilité d’améliorer l’expérience de recherche en définissant des facettes de recherches personnalisées. Mieux vous pouvez même en développer de nouvelles si vous le souhaitez. Pour rappel les facettes de recherches se situent sur la gauche de la page de résultats et vous permettent de filtrer ces résultats pour arriver plus vite aux éléments qui vous intéressent. (type de fichier, auteur, date de modification…)
Voici quelques ressources complémentaires si jamais vous désirez en savoir plus.
Chez Negotium nous avons un produit d’analyse linguistiqu (Attribute) qui permet d’extraire automatiquement des concepts (idées), des entités (personnes, lieux…) et une classification (basée sur la taxonomie). Une fois ces métadonnées extraites nous nous en servons pour générer des facettes de recherche afin d’améliorer votre expérience de recherche.
Seulement voilà, une question s’est vite posée : sur un ensemble de documents retournés par la recherche important, combien sont retournés à notre facette pour générer les valeurs de filtres ?
Pourquoi se soucier de cela ? Dépendamment du jeu de résultats fourni cela peut avoir un impact sur l’exactitude du comptage, sur la pertinence des filtres suggérés, etc…
En effet il semblerait que l’équipe produit SharePoint ait décidé de fournir moins d’éléments pour des raisons de performance, cependant ce n’est indiqué nulle part dans la documentation officielle (en date de ce post). J’ai donc dans un premier temps tenté de poser la question aux autres MVP SharePoint et à l’équipe produit (un des privilèges MVP). Aucune réponse ne m’a été fournie sur le sujet.
Nous avons donc dû passer du temps avec mon équipe à effectuer de la rétro-ingénierie sur SharePoint.
Voici les conclusions que nous avons pu en tirer :
- Par défaut SharePoint ne considère que 80% des résultats retournés pour déterminer quelles facettes sont éligibles
- Un maximum de 100 résultats sont passés à la facette pour qu’elle génère ses valeurs de filtre
- Ces valeurs sont définies en dur et nullement configurable
- Le jeu de résultats fourni dépend de la pagination (pas toujours, il peut laisser plusieurs pages avant de se mettre à jour)
En espérant que cela vous aide à concevoir et comprendre le comportement des facettes. De mon côté je vais suggérer à l’équipe produit d’ajouter ces informations à la documentation officielle et si possible de rendre une partie de ces valeurs configurable.
PS : merci à Jean-François pour son temps passé sur le sujet.