Caracteres especiales HTML

De Seobility Wiki
Saltar a: navegación, buscar

¿Qué son los caracteres especiales HTML?

Caracteres especiales HTML
Imagen: Caracteres especiales HTML - Autor: Seobility - Licencia: CC BY-SA 4.0

Los caracteres especiales de HTML son formas de escritura ubicadas fuera del alfabeto latino básico que se pueden representar en HTML como <, > y ©. Tienen un significado especial dentro de este lenguaje y se vinculan con un símbolo particular, como una flecha o un acento en una letra. Cada carácter especial se conoce como entidad y a cada entidad le corresponde un nombre y un número.

Tradicionalmente, estas grafías se dividen en varias categorías diferentes: caracteres ASCII, caracteres ISO-8859-1, símbolos ISO-8859-1, símbolos matemáticos, caracteres griegos y entidades de caracteres diversos.

¿Cómo funcionan los caracteres especiales?

A cada carácter especial de HTML se le asigna un nombre y un número de entidad y los mismos se usan para representarlo en un documento HTML. Estos códigos y nombres cuentan con un formato específico, que generalmente se representa como &#xxxx; para números y &xxxx; para nombres, donde xxxx es un nombre o un número. Los números son válidos tanto en formato decimal como hexadecimal.

Por ejemplo, el código para una flecha hacia la derecha >, también conocida como el signo 'mayor que', es &#62; para el número de entidad y &gt; para el nombre de la entidad. Al escribir uno de estos códigos en un documento HTML generará un '>' que será el símbolo que la la la usuaria/o visualice en la página.

Ahora bien, aunque se ingrese estos caracteres especiales directamente en el documento HTML, esto no garantiza su visualización e interpretación correctas, pues depende cómo se ha declarado la codificación de caracteres en el código HTML de la página.

Con todo, no hace falta memorizar ni tener todos estos caracteres a mano, pues generalmente los más comunes, como las letras con acentos, ampersand o el signo @ ya están representados directamente en el teclado.

Eso sí, en cualquier caso no se recomienda introducir caracteres especiales directamente en el código HTML, sino su codificación para que los navegadores los muestren correctamente. Esto es particularmente importante para los caracteres "mayor que (>)", "menor que (<)" así como el ampersand (&), ya que tienen un significado especial en el código HTML. Por ejemplo, "<" señala el comienzo de una etiqueta y ">" su final.

Por esta razón, los caracteres nunca deben utilizarse sin codificar si el objetivo es que una o un visitante de la web los pueda visualizar como símbolos. En su lugar, deben insertarse las siguientes codificaciones en el código HTML:

Caracteres especiales HTML más comunes

Carácter Código numérico Código de entidad
" &#34; &quot;
< &#60; &lt;
> &#62; &gt;
& &#38; &amp;
/ &#47; &frasl;
© &#169; &copy;
§ &#167; &sect;

Estos son solo algunos ejemplos, la lista completa de caracteres especiales se puede encontrar en www.manualweb.net, por ejemplo.

Beneficios y desventajas

Los caracteres especiales de HTML se introdujeron en HTML 4.0 en diciembre de 1997 con el objetivo de estandarizar todos los caracteres que quedaban fuera de la codificación ASCII de uso común. En particular, fueron muy útiles a la hora de proporcionar caracteres de acento para muchos idiomas europeos que usan una versión ligeramente modificada del alfabeto latino.

Otro beneficio de los caracteres especiales de HTML es su uso dentro del código. HTML se basa en gran medida en los caracteres menor que (<) y mayor que (>) como parte del lenguaje de marcado. Para evitar que estos signos se interpreten como HTML, se pueden usar caracteres especiales para garantizar que se muestren correctamente a los y las navegantes.

Si bien es posible usar secuencias de escape para delimitar qué símbolos son código y cuáles son parte del documento, pueden saturar fácilmente el código. Para evitar confusiones y errores de renderizado, las usuarias y usuarios pueden usar un código de entidad HTML para representar una letra que desean mostrar como parte del documento y no como parte del lenguaje de marcado.

Por otra parte, un problema con los caracteres especiales HTML es que todavía están limitados principalmente a representar caracteres dentro de los alfabetos griego y latino, además de acentos adicionales para los idiomas que usan esos alfabetos. Los idiomas con sistemas de escritura completamente diferentes, como el chino, no se pueden representar con caracteres especiales de HTML.

Como tal generalmente se prefiere Unicode cuando se codifican caracteres y signos especiales, ya que no solo representa todos los acentos, flechas y letras que se encuentran en los caracteres especiales de HTML, sino que también incluye muchos más.

Otro inconveniente es que el uso intensivo de nombres de entidad puede agrandar considerablemente la longitud de un documento. Esto no es un problema con un uso moderado, pero para idiomas con muchas letras con acentos o signos, el uso extensivo de caracteres especiales HTML puede aumentar significativamente el tamaño total de una página.

Importancia de los caracteres especiales HTML para el SEO

Los caracteres especiales de HTML son importantes para el SEO porque permiten tanto la correcta visualización de los caracteres como también una buena interpretación de los mismos por parte de los buscadores.

El uso de codificaciones de caracteres no estándar para letras y acentos puede dar lugar a que los motores de búsqueda los interpreten incorrectamente o no los interpreten en absoluto y hacer que el contenido sea más difícil de entender e indexar.

Los buscadores generalmente están optimizados para Unicode, por lo que se recomienda utilizar esta codificación siempre que sea posible. Esto se debe a que todos los signos, acentos y caracteres compatibles con los caracteres especiales de HTML también son compatibles con Unicode, además de muchos más. De hecho, Unicode se ha convertido en el estándar de la industria y, por lo tanto, en el formato de codificación de caracteres más compatible.

A pesar de esto aún se puede usar los caracteres especiales de HTML de una manera amigable con el SEO. Lo más importante es especificar el formato de codificación de caracteres para garantizar su correcta visualización e interpretación en los resultados de búsqueda. Se recomienda hacer esto dentro del Content Type en el header o cabecera HTTP de un documento o también especificándolo dentro de una metaetiqueta HTML en este último.

Ampliar conocimientos

Sobre las autoras y autores:
Seobility S
El equipo de Seobility Wiki está formado por expertas y expertos SEO, profesionales del marketing digital y especialistas en negocios con experiencia en SEO, marketing online y desarrollo web. Todos nuestros artículos pasan por un proceso editorial de varios niveles para proporcionarte la mejor calidad posible e información relevante y de utilidad. Conoce a la gente que hay detrás de la Wiki de Seobility.

Contenidos relacionados