Diferencia entre revisiones de «Ayuda:Caracteres especiales»

De Wikipedia, la enciclopedia libre
Contenido eliminado Contenido añadido
Leonardo (discusión · contribs.)
Sin resumen de edición
(Sin diferencias)

Revisión del 20:34 28 sep 2001

Varios caracteres que no hacen parte del repertorio ASCII estándar serán útiles--incluso necesarios-- para las páginas Wiki, especialmente las páginas internacionales. Esta página contiene mis recomendaciones sobre aquellos caracteres que se pueden utilizar con seguridad y cómo usarlos. Existen tres formas de ingresar un caracter no-ASCII en una página Wiki:


  • Ingrese el caracter directamente desde el teclado apropiado, o copiándolo de alguna aplicación tipo "mapa de caracteres" y luego pegándolo, o por medio de recursos especiales que pueda ofrecer su sistema operativo, o programa de edición de texto. El servidor web deberá entonces ser configurado para reportar cuál juego de caracteres de 8-bit se debe usar.
  • Utilice una entidad de referencia HTML conocida como por ejemplo à. Este es el método más confiable, y no resulta ambiguo aun cuando el servidor no anuncia el uso de algún juego de caracteres especial, e incluso cuando el caracter no se muestra apropiadamente en algunos navegadores.
  • Utilice una entidad numérica de referencia HTML como por ejemplo ¡. Esto no se recomienda, ya que muchos navegadores interpretan incorrectamente estas entidades como referencias al juego de caracteres nativo. Sin embargo, esta es la única forma de ingresar valores Unicode para los que no existe entidad alguna, como las letras del idioma /Turco. Note que debido a que los caracteres a los que apuntan los valores 128 al 159 no se usan tanto en ISO-8859-1 como en Unicode, las referencias en este rango como ƒ son inválidas y ambiguas, aun cuando sean usadas con frecuencia por varios sitios web.


Por lo general, idiomas de europa occidental como Español, Francés y Alemán poseen pocos problemas. Para leer más detalles específicos sobre otros lenguajes, visite: /Turco (más idiomas pueden agregarse a la lista en la medida que aparezcan colaboradores de otros lenguajes).



Caracteres ISO-8859-1


Los siguientes caracteres de ASCII extendido se pueden usar con seguridad en todas las páginas Wiki. La siguiente tabla lista el caracter en sí, el código para cada caracter en decimal y en hexadecimal, el nombre de la entidad HTML, y el nombre común del caracter.


LiteralHexDecEntidadCaracter
 00A00160 espacio que no produce saltos de línea
¡00A10161¡exclamación invertida
¢00A20162¢signo de centavo
£00A30163£signo de libra
¤00A40164¤signo de moneda internacional
¥00A50165¥signo de yen
§00A70167§signo de sección
¨00A80168¨diéresis
©00A90169©signo de copyright
ª00AA0170ªindicador ordinal femenino
«00AB0171«comillas anguladas de apertura
¬00AC0172¬signo de negación lógica
®00AE0174®signo de marca registrada
¯00AF0175¯raya alta
°00B00176°signo de grado
±00B10177±signo de más/menos
´00B40180´acento agudo
µ00B50181µsigno de micro
00B60182¶signo de fin de parágrafo
·00B70183·punto medio (coma Georgiana)
¸00B80184¸cedilla
º00BA0186ºindicador ordinal masculino
»00BB0187»comillas anguladas de cierre
¿00BF0191¿signo de interrogación invertido
À00C00192ÀA con acento grave
Á00C10193ÁA con acento agudo
Â00C20194ÂA con acento circunflejo
Ã00C30195ÃA con tilde
Ä00C40196ÄA con diéresis
Å00C50197ÅA con anillo
Æ00C60198ÆDiptongo (ligadura) AE
Ç00C70199ÇC cedilla
È00C80200ÈE con acento grave
É00C90201ÉE con acento agudo
Ê00CA0202ÊE con acento circunflejo
Ë00CB0203ËE con diéresis
Ì00CC0204ÌI con acento grave
Í00CD0205ÍI con acento agudo
Î00CE0206ÎI con acento circunflejo
Ï00CF0207ÏI con diéresis
Ñ00D10209ÑN con tilde
Ò00D20210ÒO con acento grave
Ó00D30211ÓO con acento agudo
Ô00D40212ÔO con acento circunflejo
Õ00D50213ÕO con tilde
Ö00D60214ÖO con diéresis
Ø00D80216ØO con barra
Ù00D90217ÙU con acento grave
Ú00DA0218ÚU con acento agudo
Û00DB0219ÛU con acento circunflejo
Ü00DC0220ÜU con diéresis
ß00DF0223ßs minúscula (Alemán) - beta minúscula
à00E00224àa con acento grave
á00E10225áa con acento agudo
â00E20226âa con acento circunflejo
ã00E30227ãa con tilde
ä00E40228äa con diéresis
å00E50229åa con anillo
æ00E60230ædiptongo (ligadura) ae
ç00E70231çc cedilla
è00E80232èe con acento grave
é00E90233ée con acento agudo
ê00EA0234êe con acento circunflejo
ë00EB0235ëe con diéresis
ì00EC0236ìi con acento grave
í00ED0237íi con acento agudo
î00EE0238îi con acento circunflejo
ï00EF0239ïi con diéresis
ñ00F10241ñn con tilde
ò00F20242òo con acento grave
ó00F30243óo con acento agudo
ô00F40244ôo con acento circunflejo
õ00F50245õo con tilde
ö00F60246öo con diéresis
÷00F70247÷signo de división
ø00F80248øo con barra
ù00F90249ùu con acento grave
ú00FA0250úu con acento agudo
û00FB0251ûu con acento circunflejo
ü00FC0252üu con diéresis
ÿ00FF0255ÿy con diéresis


Estos caracteres son un subconjunto de los símbolos más frecuentemente usados en Internet del juego de caracteres ASCII extendido, ISO 8859-1. Las páginas de Wikipedia son identificadas por el servidor como páginas con texto ISO-8859-1. Los caracteres mencionados anteriormente son un grupo seleccionado para mejorar la compatibilidad con otras máquinas.


Por ejemplo, el Macintosh Apple se utiliza con frecuencia para su uso en Internet, no se encuentra limitado a ningún idioma en especial, y su juego de caracteres nativo (que no es ISO-8859-1) contiene muchos de los caracteres internacionales. Varios navegadores para Macintosh traducen correctamente texto ISO en el juego de caracteres nativo, siempre y cuando los caracteres usados estén disponibles. Así que la tabla descrita antes es un subconjunto de caracteres ISO-8859-1 que también se encuentran disponibles en el juego de caracteres nativo de Macintosh. El documento de código estándar 1252 de Microsoft Windows es un conjunto ampliado de ISO-8859-1, así que estos caracteres también están disponibles en máquinas Windows. Los juegos de caracteres Latinos más comunes aparte del ISO-8859-1 son el documento de código MS-DOS 437 (pre-Windows), el Macintosh Roman, y otros conjuntos ISO como el ISO-8859-2. El número de máquinas pre-Windows MS-DOS con navegadores web es reducido y con frecuencia son máquina dedicadas a un propósito específico que no usarían Wikipedia de todas formas, así que es razonablemente seguro sacrificar la compatibilidad con aquellas máquinas a favor de los caracteres extranjeros necesitados. Otros conjuntos ISO por lo general están orientados para ser leídos por otros navegadores que usan el mismo juego de caracteres en un mismo país, y por lo tanto esas páginas deberían utilizar un juego de caracteres específico a tal idioma.


Estos caracteres pueden ingresarse bien sea usando referencias a entidades HTML conocidas como à, directamente por medio de teclados extranjeros, o por medio de cualquier tipo de recurso que esté disponible al autor de páginas Wiki que necesite ingresar estos caracteres. Por ejemplo, autores Wiki que usan máquinas Windows pueden ingresar estos caracteres manteniendo pulsada la tecla Alt mientras que escriben el código decimal de 4 dígitos correspondientes al caracter en el sector numérico del teclado. Es importante que todos los 4 dígitos (incluyendo el 0 del comienzo) se ingresen; usando un código de 3 dígitos producirá que se ingresen caracteres del obsoleto documento de código 437. Autores Wiki que usan máquinas Macintosh deben tener cuidado de usar recursos especiales para ingresar estos caracteres en formato ISO-8859-1 en lugar de hacerlo con el juego de caracteres nativo, o bien puede usar las referencias a entidades HTML conocidas. Note que algunos usuarios de Windows pueden experimentar problemas con versiones del navegador Microsoft Internet Explorer que utilizan "Alt-Flecha Izquierda" y "Alt-Flecha Derecha" para el desplazamiento entre páginas. Estas combinaciones interfieren con el ingreso de códigos que contienen los dígitos 4 y 6. En este caso use referencias a entidades HTML.


Los caracteres de la tabla descrita pueden ser utilizados directamente como caracteres 8-bit en todas las páginas Wiki, y son suficientes para todas las páginas escritas principalmente en Inglés, Español, Francés, Alemán e idiomas que no requieren caracteres especiales a parte de aquellos (como el Catalán). A pesar de su seguridad general, en este momento, no es posible utilizar estos caracteres en títulos de páginas Wiki en la Wikipedia en Inglés, aunque algunos de los Wikipedia Internacionales se encuentran configurados para aceptarlos.


Caracteres inseguros


Note en especial lo que hace falta aquí del juego de caracteres ISO-8859-1 completo: La barra vertical partida (0166=¦), el guión suave (0173=­), los dígitos en superíndice (0178=², 0179=³), las fracciones comunes (0188=¼, 0189=½, 0190=¾), los caracteres eth y thorn islandeses (0208=Ð, 0240=ð, 0222=Þ, 0254=þ), y el signo de multiplicación (0215=×). Estos deberían considerarse inseguros (aparte existen sustitutos adecuados para muchos de ellos).


Debe tenerse especial cuidado con aquellos caracteres que existen en el juego de caracteres nativo de algunas máquinas populares pero no en el conjunto mencionado anteriormente. No son seguros, aun cuando posiblemente usted los vea correctamente cuando los usa. Entre los caracteres que hacen parte del documento de código 1252 Windows pero no en el ISO-8859-1 se encuentran el signo del euro (€), la cruz y la doble cruz (†, ‡), la viñeta (•), el signo de marca registrada (™), los signos de puntuación con estilo (ver más adelante), el signo por mil (‰), algunas letras con acento caron del Este de Europa, y los diptongos oe. Entre los caracteres del juego de caracteres Macintosh Roman que no hacen parte del ISO-8859-1 se encuentran la cruz y doble cruz, la viñeta, el signo de marca registrada, algunos pocos símbolos matemáticos como el infinito (∞) y el no-igual (≠), algunas letras Griegas comúnmente usadas como pi (π), diptongos (ligaduras) como oe y fl, signos de puntuación con estilo, el signo de por mil, y algunos acentos como el breve, onogek y el caron.


El lenguaje de etiquetas HTML 4.0 define entidades para algunos caracteres Latinos no incluidos en el ISO-8859-1 y que son utilizados por idiomas populares, como el diptongo OE (Œ, œ), la Y mayúscula con diéresis (Ÿ), y algunos caracteres del Este de Europa con acentos como š. Estos también son inseguros; aun cuando si se ingresan como referencias a entidades HTML, puede que se muestren correctamente en algunas máquinas.


En resumen, no asuma que es seguro utilizar algún caracter especial solo porque se ve bien en su máquina. Utilice los caracteres de la tabla listada antes, y lea y entienda como usar los otros que se mencionan más abajo.


Caracteres no-ISO posiblemente utilizables


Algunos caracteres que no fueron listados como seguros antes aún pueden resultar utilizables cuando se ingresan como referencias a entidades HTML, ya que los navegadores web los reconocen e interpretan correctamente, quizás utilizando fuentes de caracter alternativas según se requiera. Todos estos caracteres deben ser considerados menos seguros que los mencionados antes, pero solo en el sentido de que puede que no se muestren apropiadamente en algunas máquinas, aunque en forma de referencias a entidades HTML no resultan ambiguos, y preservan la integridad de los datos.


Para muchos de estos, se encuentran disponibles sustitutos adecuados y arreglos, y deberían ser utilizados cuando la importancia de hacer el texto adecuado para usuarios de máquinas y software antiguo sobrepasa la importancia que puede tener una buena presentación para aquellos con software más reciente (a juicio del autor o editor).



Signos de puntuación con estilo


Ausentes en el juego de caracteres ISO-8859-1, pero utilizados con frecuencia y presentes tanto en los conjuntos Macintosh Roman y el documento de código Windows 1252, existen algunos signos de puntuación (comillas y rayas) apropiados para idiomas como el Inglés y el Español que poseen cierto estilo único. Estos pueden ingresarse como referencias a entidades, y deberían mostrarse correctamente en la mayoría de máquinas que posean software reciente. Incluso en máquinas basadas en estándares ISO como Unix/X, los navegadores deberían ser capaces de interpretar estas referencias y realizar las sustituciones apropiadas utilizando simples comillas y rayas de ASCII plano (Mozilla hace esto correctamente, por ejemplo). Estas referencias no existían en versiones antiguas de HTML, por lo que es posible que no sean reconocidas por software poco reciente. Ya que utilizando estos caracteres se mantiene la integridad de los datos incluso en aquellas máquinas que no los muestran correctamente, se pueden considerar seguros de usar a menos que un despliegue adecuado en software antiguo sea crítico. Las comillas alemanas "low-9" son un caso similar, pero es menos frecuente que sean traducidas por software, y por lo tanto no son tan seguras. La siguiente tabla muestra estos caracteres a continuación de una "O" mayúscula para mejor visibilidad:


‘O ‘ comilla izquierda sencilla
’O ’ comilla derecha simple
“O “ comilla izquierda doble
”O ” comilla derecha doble
—O — raya larga
–O – raya corta
‚O ‚ comilla low-9 sencilla
„O „ comilla low-9 doble


Muchos sitios web orientados a una audiencia de usuarios de Windows utilizan referencias del documento de código 1252 para estos caracteres: por ejemplo, utilizando — para la raya larga. Esta no es una pactica recomendada. Con el propósito de asegurar la futura integridad de los datos y máxima compatibilidad, se deben reescribir estos caracteres a referencias como —.


Letras Griegas y símbolos matemáticos


Los estándares web para escribir expresiones matemáticas son muy recientes (de hecho MathML 2.0 fue publicado apenas en Febrero de 2001), por lo que muchos navegadores que fueron creados antes de que estos estándares aparecieran trataron de compensar esta limitación permitiendo al menos el uso de algunos caracteres utilizados con frecuencia en matemáticas, incluyendo gran parte del alfabeto Griego. Estos necesariamente se ingresan como referencias a entidades. Algunos navegadores con frecuencia interpretan estos símbolos utilizando la fuente de caracter "Symbol" o algo similar.


Las letras Griegas mayúsculas y minúsculas simplemente usan sus nombres completos como entidades. Estos caracteres deberían, por supuesto, ser utilizados únicamente para representar letras Griegas ocasionales en texto principalmente Latino. Texto realmente Griego debería ser escrito utilizando un juego de caracteres griego para evitar archivos sobrecargados y de pobre respuesta. Aquí hay algunos ejemplos:


α α
Γ Γ
β β
Λ Λ
γ γ
Σ Σ
π π
Π Π
σ σ
Ω Ω
ς ς (sigma "final", únicamente en minúscula)


Otros símbolos matemáticos comunes:


≠
′
≤
″
≥
∂
≡
∫
≈
∑
∞
∏
√


Muchos de los símbolos en la fuente de caracter de Windows "Symbol" usados para interpretar símbolos matemáticos (como los segmentos de corchetes expandibles) no están presentes on muchas otras máquinas, y ni siquiera están presentes en el Unicode 3.1 o como entidades HTML (aunque se encuentran planeados para Unicode 3.2). Estos son utilizados en productos como TtH para interpretar ecuaciones. Debe saber que si usted utiliza esos símbolos, usted estará restringiendo su audiencia a usuarios de Windows (sea aceptable o no es un juicio que usted tendrá que hacer como autor).


Otros símbolos comunes


Algunos caracteres como la viñeta, el signo de la moneda euro, y el signo de marca registrada son casos especiales. Es muy factible que sean asimilados e interpretados de alguna manera en muchos navegadores. Debido a que son importantes para el comercio internacional, muchos sistemas los agregan a fuentes de caracter en alguna ubicación no-estándar y los interpretan cuando se solicitan, o de lo contrario simplemente los interpreta en modos especiales que no requieren que se encuentren presentes en alguna fuente. Consulte la tabla a continuación para ver cómo interpreta su navegador los siguientes símbolos:


• Viñeta
€ Signo de la moneda euro
™ Signo de marca registrada


Entre otros símbolos un poco menos comunes se encuentran los siguientes:


† cruz
‡ doble cruz
◊ diamante
‰ signo por mil
← flecha hacia la izquierda
↑ flecha hacia arriba
→ flecha hacia la derecha
↓ flecha hacia abajo
♠ pinta negra de espadas
♣ pinta negra de picas
♥ pinta negra de corazones
♦ pinta negra de diamantes
‹ comilla angulada sencilla de apertura
› comilla angulada sencilla de cierre


El uso de estos símbolos debe considerarse inseguro excepto quizá en páginas orientadas a una audiencia específica que muy probablemente utilice software bastante actualizado sobre máquinas populares.


Unicode


The Unicode character encoding UCS-4 is the official character encoding of HTML 4.0. Many browsers, though, are only capable of displaying a small subset of the full UCS-4 repertoire. For example, the codes Й ק م display on your browser as Й, ק, and م, which ideally look like the Cyrillic letter "Short I", the Hebrew letter "Qof", and the Arabic letter "Meem", respectively. It is unlikely that your computer has all of those fonts and will display them all correctly, though it may display a subset of them. Because they are encoded according to the standard, though, they will display correctly on any system that is compliant and does have the characters available. Numeric character entity references are the only way to enter these characters into a Wiki page at present. Note that encoding them using decimal rather than hexadecimal (e.g. Й instead of Й) will increase the number of browsers on which they will work.


Vea también Unicode y HTML para consultar tablas de entidades de caracteres.


/Windows


/Discusión