Qu’appelle-t-on Web sémantique ?

Le Web sémantique est le prochain stade de développement du World Wide Web. Dans ce que l’on nomme aussi le Web 3.0, les informations ne sont pas seulement interconnectées, les contenus sont également enrichis de métadonnées sémantiques lisibles par machine et reliées entre elles. Le but est d’optimiser l’échange d’informations sur le Web en faisant en sorte que les machines distinguent et traitent spécifiquement les données lisibles par machine, c’est-à-dire les contenus sémantiques.

Nom de domaine
Votre domaine en un clic
  • Domaine .eu ou .fr + éditeur de site gratuit pendant 6 mois
  • 1 certificat SSL Wildcard par contrat
  • Boîte email de 2 Go

Web sémantique : historique du concept

Le concept de « Web sémantique » (semantic Web) n’est qu’un des nombreux termes visant à définir une évolution sémantique du World Wide Web. Les termes suivants, qui désignent le réseau mondial d’informations liées sémantiquement, ont également cours :

  • Web 3.0 : inventé par le journaliste américain John Markoff pour décrire l’ajout au Web 2.0 interactif et collaboratif de données lisibles par machine.
  • GGG (Giant Global Graph) : employé par Tim Berners-Lee, l’inventeur du WWW, pour décrire la structure globale de l’information qu’utilise la structuration sémantique des métadonnées et du contenu ; d’un point de vue conceptuel, le GGG recoupe le Web sémantique.
  • Linked Open Data : introduit en 2007 pour mettre l’accent sur les normes relatives aux métadonnées, les routines d’interrogation et les données sémantiques en réseau comme fondement du Web sémantique.
  • Web des données : inventé en 2013 par le W3C, le World Wide Web Consortium, pour désigner sous un seul terme l’interconnexion syntaxique et sémantique des données.
Définition: Sémantique

La sémantique est une branche de la linguistique qui étudie la signification des caractères et des chaînes de caractères. Le Web sémantique (« semantic Web » en anglais) ajoute des informations sémantiques au contenu Web et donne aux machines la capacité de distinguer leur sens. (Selon le contexte, un signe, par exemple un mot, peut avoir plusieurs sens, tandis que plusieurs signes peuvent avoir le même sens.) À cette fin, diverses normes et ontologies (ensembles d’informations) sont utilisées pour la formulation de métadonnées sémantiques lisibles par machine.

Historique du Web sémantique

À ce jour, le WWW repose essentiellement sur la syntaxe de l’information. Pour ce faire, les programmes informatiques utilisent des algorithmes qui analysent les index de données, les mots-clés et les requêtes de recherche. En fonction du caractère explicite d’une requête, les moteurs de recherche fournissent des résultats de recherche (SERP pour « Search Engine Result Page ») plus ou moins appropriés.

Cependant, il est important pour les utilisateurs et les entreprises que les programmes traitent les intentions de recherche des utilisateurs aussi efficacement que possible. Par conséquent, le Web sémantique n’est pas seulement basé sur les termes de recherche et la syntaxe, mais aussi sur les valeurs de sens. Les machines peuvent trouver du contenu et comprendre et distinguer sa signification.

Par exemple, si un utilisateur pose la question « Quand le mandat d’Emmanuel Macron a-t-il commencé ? », les moteurs de recherche actuels n’indiqueront pas « 14 mai 2017 » comme réponse, mais plutôt les résultats les plus appropriés possibles pour Emmanuel Macron sur la base des mots-clés. Dans le Web sémantique, cependant, les machines comprennent le contenu, mais aussi le sens de la requête et fournissent une réponse précise. L’analyse des sens ne porte pas seulement sur les textes, mais aussi sur les images, les sons, les chiffres et les symboles, autrement dit sur tous les objets porteurs d’une signification.

Les bases du Web sémantique

La base du Web sémantique est le Web 1.0 et le Web 2.0, du moins si l’on entend par Web sémantique le prochain stade d’évolution du World Wide Web, autrement dit le Web 3.0. Si cela ne tenait qu’à Tim Berner-Lee, fondateur du WWW, le Web 1.0 aurait déjà été orienté vers les sens en plus de l’emplacement et de la forme des informations.

Le Web « classique » repose sur des normes telles que HTML, URL et HTTP, à savoir respectivement un langage de balisage, un descripteur d’adresse et un protocole de transmission, pour structurer les données. Cependant, la plupart des contenus Web sont encore répartis de manière non structurée sur le Web.

Les documents HTML indiquent rarement ce que signifie leur contenu et en quoi il diffère des autres. Bien que des métadonnées soient déjà employées, leur valeur informative est encore limitée. Les programmes informatiques peuvent donc rechercher des adresses de contenu, mais ne savent pas déterminer ce que signifie l’information qu’ils recherchent ou en quoi elle diffère des autres. Des déclarations logiques supplémentaires aident les programmes à trouver le contenu, mais aussi à le comprendre lorsqu’il est placé dans un contexte sémantique préformulé.

Que sont les entités et les ontologies ?

Les entités et les ontologies comptent parmi les principaux composants du Web sémantique. Le concept « d’entité » est issu de la sémantique. Cette unité de sens est constituée d’un identifiant et d’attributs associés. Exemple : « Barack Obama » serait l’identifiant d’une entité, tandis que des informations telles que « président des États-Unis », « avocat », « démocrate » en seraient les attributs, c’est-à-dire des caractéristiques descriptives. Les entités peuvent être liées les unes aux autres et apparentées thématiquement ou sans rapport.

Lorsque des entités sont liées entre elles contextuellement, on parle d’ontologies. Les ontologies sont des ensembles ordonnés d’informations et de déclarations logiques formulés de manière lisible pour les humains et les machines, qui établissent des liens et montrent les relations.

Les entités et les ontologies sont essentielles au fonctionnement du Web sémantique. Elles sont indispensables pour que les programmes puissent comprendre les relations entre les mots, les syntaxes, les images et les caractères, filtrer intelligemment les termes polysémiques et le duplicate content, interpréter le contenu Web et différencier les entités par thème. Il en résulte un riche réseau de connaissances qui ne se compose pas uniquement d’informations, de mots-clés et d’adresses non structurés. Les intelligences artificielles seront à l’avenir capables d’effectuer une recherche dans les connaissances accumulées sur le WWW, mais aussi de les comprendre et de les interpréter de manière productive.

Nom de domaine
Votre domaine en un clic
  • Domaine .eu ou .fr + éditeur de site gratuit pendant 6 mois
  • 1 certificat SSL Wildcard par contrat
  • Boîte email de 2 Go

Comment fonctionne le Web sémantique ?

Pour réaliser le Web sémantique, les programmes informatiques doivent apprendre à extraire le sens des mots et des phrases. Cela n’est possible que si les contenus existants ou nouveaux du WWW contiennent des données structurées qui sont formulées de manière à être lisibles par une machine. Les données structurées sont formulées au moyen de normes et de classifications spéciales et encodées sur les sites Web sous la forme de « schema markups » et « in-page markups ».

Grâce aux données structurées, les programmes peuvent déterminer clairement ce qui, par exemple, différencie l’objet « banque » désignant une institution financière de l’objet « banque » désignant une base de données. Pour un langage uniforme lisible par machine, des normes du Web sémantique, comme le Consortium W3 les a déjà formulées, sont nécessaires.

Le Contextual Browsing Language (CBL), qui décrit les relations entre les informations, et le Web Ontology Language (OWL), qui ordonne et classe les informations de manière hiérarchique, sont d’autres approches de normes uniformisées du Web sémantique. Les langages et normes suivants aident eux aussi à créer des métadonnées, des normes et des règles sémantiques :

  • RDF/RDFa (Resource Description Network in Attributes) : utilisé pour décrire en détail les sites Web afin d’en tirer des déclarations logiques et sémantiques sur n’importe quel contenu ; peut être complété par RDFa pour intégrer RDF dans XML.
  • URI (Uniform Resource Identifier) : identifie les unités d’information et renvoie simultanément aux Linked Open Data (LOD) librement disponibles, c’est-à-dire des données complémentaires dans les documents HTTP.
  • RIF (Rule Interchange Format) : définit les règles selon lesquelles les liens sémantiques doivent être établis.
  • Dublin Core : une norme pour les métadonnées incluses dans les documents numériques et pour l’interprétation lisible par machine des éléments formulés en RDF.
  • RDFS (Resource Description Framework Schema) : identifie le vocabulaire RDF et spécifie la structure et la syntaxe à employer.
  • SPARQL (SPARQL Protocol And RDF Query Language) : sert de langage et de protocole de requête pour le contenu du système RDF, lequel consiste en des descriptions logiques et des interrelations de données.

Le Web sémantique et son importance pour le marketing en ligne

Les avantages du Web sémantique pour le marketing en ligne ne sont pas négligeables. Les entreprises sont d’ores et déjà contraintes de s’adapter à la numérisation du monde des affaires. Celles qui analysent le comportement d’achat et de recherche des clients et groupes cibles peuvent en tirer des enseignements et générer davantage de trafic. Dans le domaine du marketing en ligne, la publicité axée sur la sémantique du contenu Web peut être mieux adaptée et liée à des mots-clés correspondant à ses produits et services.

Pour les sites Web au référencement optimisé, il ne s’agit pas seulement des bons mots-clés, mais aussi d’informations sémantiques complémentaires servant à structurer les contenus et à fournir une architecture d'informations lisible par machine. Pensez à inclure des données structurées dans votre site Web et à faire en sorte que son contenu soit aussi significatif que possible à l’aide de normes sémantiques. De cette manière, vous améliorerez votre référencement et serez également repéré par les groupes cibles que vous souhaitez attirer.

Exemples pratiques pour le Web sémantique

Le Web sémantique n’en est encore qu’à ses balbutiements, mais de premiers pas dans la bonne direction ont été faits ces dernières années. Par exemple, les possibilités du Web sémantique sont visibles dans l’algorithme RankBrain de Google, lequel est capable d’affecter par thème des requêtes de recherche jusqu’ici inconnues de l’algorithme. La recherche d’images de Google « reconnaît » elle aussi déjà ce que les utilisateurs recherchent et fournit des résultats d’image proches thématiquement.

De même, la fonctionnalité Knowledge Graph de Google sait reconnaître des entités sémantiques et afficher les informations connexes ou apparentées les plus importantes en plus des résultats de recherche. Les « rich snippets » et les « rich cards » de Google, quant à eux, traitent des données structurées sous forme de carrousels d’informations et d’extraits de sites Web.

Conseil

Avoir un site Web attrayant et moderne est important, mais un contenu clairement formulé et optimisé pour les moteurs de recherche l’est tout autant. Servez-vous de l’outil rankingCoach de IONOS pour améliorer le référencement de votre site Web et cibler les clients qui recherchent vos produits et services.

Cet article vous a-t-il été utile ?
Page top