Comprendre: le balisage SGML, HTML et le XML qui sont des systèmes de formatage pour définir et récupérer des pages web sur internet.

Qu’est-ce que le langage de balisage

Le langage de balisage est un système standard de codage de texte constitué d’un ensemble de symboles insérés dans un document texte pour en contrôler la structure, le formatage ou la relation entre ses parties. Les langages de balisage les plus utilisés sont le SGML (Standard Generalized Markup Language), le HTML (Hypertext Markup Language) et le XML (Extensible Markup Language). Les symboles de balisage peuvent être interprétés par un dispositif (ordinateur, imprimante, navigateur, etc.) pour contrôler l’aspect du document lorsqu’il est imprimé ou affiché sur un écran. Un document balisé contient donc deux types de texte : le texte à afficher et le langage de balisage sur la façon de l’afficher.

Qu’est-ce que le SGML ?

Le SGML, en abrégé standard generalized markup language, est une norme informatique internationale pour la définition des langages de balisage ; c’est donc un métalangage. Le balisage consiste en des notations appelées « balises », qui spécifient la fonction d’un morceau de texte ou la manière dont il doit être affiché. SGML met l’accent sur le balisage descriptif, dans lequel une balise peut être <emphasis>. Une telle balise indique la fonction du document et peut être interprétée comme de la vidéo inversée sur un écran d’ordinateur, du soulignement sur une machine à écrire ou de l’italique dans un texte composé.

Le SGML est utilisé pour spécifier des DTD (définitions de type de document). Une DTD définit un type de document, tel qu’un rapport, en spécifiant les éléments qui doivent apparaître dans le document – par exemple, <Titre> – et en donnant des règles pour l’utilisation des éléments du document, par exemple, un paragraphe peut apparaître dans une entrée de tableau, mais un tableau ne peut pas apparaître dans un paragraphe. Un texte balisé peut être analysé par un programme d’analyse syntaxique pour déterminer s’il est conforme à une DTD. Un autre programme peut lire les balises pour préparer un index ou traduire le document en PostScript pour l’impression. Un autre encore peut générer des caractères de grande taille ou améliorés, ou des fichiers audio pour les lecteurs souffrant de handicaps visuels ou auditifs.

Qu’est-ce que le HTML ?

Le HTML, en anglais full hypertext markup language, est un système de formatage pour l’affichage de matériel récupéré sur Internet. Chaque unité de recherche est appelée page Web (du World Wide Web), et ces pages contiennent souvent des liens hypertextes qui permettent de rechercher des pages connexes. HTML est le langage de balisage pour le codage des pages Web. Il a été conçu par le scientifique britannique Sir Tim Berners-Lee au laboratoire de physique nucléaire du CERN, en Suisse, dans les années 1980. Les balises HTML spécifient les éléments du document tels que les titres, les paragraphes et les tableaux. Elles balisent un document en vue de son affichage par un programme informatique appelé navigateur Web. Le navigateur interprète les balises et affiche les titres, les paragraphes et les tableaux dans une disposition adaptée à la taille de l’écran et aux polices dont il dispose.

Les documents HTML contiennent également des ancres, qui sont des balises spécifiant des liens vers d’autres pages Web. Une ancre a la forme <A HREF= « https://www.seoinside.fr »> SEO Inside</A>, où la chaîne entre guillemets est l’URL (localisateur universel de ressources) vers laquelle pointe le lien (l' »adresse » Web) et le texte qui la suit est ce qui apparaît dans un navigateur Web, souligné pour montrer qu’il s’agit d’un lien vers une autre page. Ce qui s’affiche comme une page unique peut également être formé de plusieurs URL, certaines contenant du texte et d’autres des graphiques.

Qu’est-ce que le XML ?

Le XML, en anglais full extensible markup language, est un langage de formatage de documents utilisé pour certaines pages du World Wide Web. Le XML a commencé à être développé dans les années 1990 parce que le HTML (hypertext markup language), le format de base des pages Web, ne permet pas de définir de nouveaux éléments de texte, c’est-à-dire qu’il n’est pas extensible. Le XML est une forme simplifiée du SGML (standard generalized markup language) destinée aux documents publiés sur le Web. Comme le SGML, le XML utilise des DTD (définitions de type de document) pour définir les types de documents et la signification des balises qui y sont utilisées. Le XML adopte des conventions qui facilitent l’analyse syntaxique, comme le fait que les entités du document sont marquées par une balise de début et une balise de fin, par exemple <BEGIN>…</BEGIN>. XML fournit plus de types de liens hypertextes que HTML, comme les liens bidirectionnels et les liens relatifs à une sous-section du document.

Comme un auteur peut définir de nouvelles balises, une DTD XML doit également contenir des règles qui indiquent à un navigateur Web comment les interpréter – comment une entité doit être affichée ou comment elle doit générer une action telle que la préparation d’un message électronique.

codage

SEO INSIDE est une agence SEO.

 

--

 

SEO Inside est une agence web et SEO - en savoir plus sur nous:

Agence web / Audit SEO / Conseil SEO / Création de site internet / Refonte de site internet optimisé pour le SEO / Référencement naturel / Référencement local /Netlinking / Formation SEO / E-Réputation et avis

Voici nos implantations :
Lille / Dunkerque / Amiens – ce sont nos 3 bureaux historiques.

Puis voici nos zones géographiques d’intervention :
Paris / Abbeville / Rouen / Compiègne / Reims / Metz / Caen / Evreux / Nancy / Colmar / Rennes / Le Mans / Orléans / Dijon / Besançon / Angers / Nantes / La Rochelle / Poitiers / Limoges /Clermont-Ferrand / Lyon / Annecy / Grenoble / Valence / Bordeaux / Montauban / Toulouse / Biarritz / Montpellier / Marseille / Cannes / Nice / Avignon / Monaco

SEO INSIDE est une agence web spécialiste en référencement naturel qui se veut proche de vous. Contactez-nous pour discuter de vos projets.