Para Qué Sirve y qué es el Código ASCII

Código ASCII

ASCII es un acrónimo de American Standard Coda para Información Interchange. Es un código que utiliza números para representar caracteres. A cada letra se le asigna un número entre 0 y 127.

A los caracteres en mayúsculas y minúsculas se les asignan números diferentes. Asimismo lo que se conoce como carácter de tipo A se le asigna el número decimal 65, mientras que a se asigna el decimal 97 como se muestra a continuación en la tabla ASCII.

El código ASCII es anterior a Internet y ha existido desde los días de los teletipos y las impresoras mecánicas. Los números decimales ASCII del 0 al 31 representan códigos de control que no se usan mucho en estos días. Sin embargo, si está jugando con protocolos de comunicación, verá estos códigos de control en uso. La tabla de códigos de control ASCII, explica qué son estos códigos de control.

¿Cuándo se usa el código ASCII?

Cuando una computadora envía datos, las teclas que presiona o el texto que envía y recibe se envían como un grupo de números. Estos números representan los caracteres que usted escribió o generó.

Debido a que el rango de ASCII estándar es de 0 a 127, solo requiere 7 bits o 1 byte de datos. Por ejemplo, para enviar la cadena cactus.io como ascii se traduciría a 99 97 99 116 117 115 46 105 111. Los microprocesadores solo entienden bits y bytes. Para ello todo es una secuencia de bits.

Es un estándar que asigna letras, números y otros caracteres en las 256 ranuras disponibles en el código de 8 bits. El número decimal ASCII (Dec) se crea a partir de binario, que es el idioma de todas las computadoras. Como se muestra en la tabla a continuación, el carácter “h” en minúscula (Char) tiene un valor decimal de 104, que es “01101000” en binario.

ASCII fue desarrollado y publicado por primera vez en 1963 por el comité X3, Así como el comité de asociaciones estándar. La norma ASCII se publicó por primera vez como ASA X3.4-1963, con diez revisiones de la norma que se publicaron entre 1967 y 1986 .La tabla ASCII está dividida en tres secciones diferentes.

  • No imprimible, códigos de sistema entre 0 y 31.
  • Bajo ASCII, entre 32 y 127. Esta tabla se origina en los sistemas más antiguos de Estados Unidos, que funcionaban en tablas de caracteres de 7 bits.
  • ASCII superior, entre 128 y 255. Esta parte es programable; los caracteres se basan en el idioma de su sistema operativo o programa que está utilizando. Las letras extranjeras también se colocan en esta sección.

¿Cuál es la diferencia entre un código ASCII y un código HTML?

El código ASCII original solo tenía un rango de 128 caracteres, que está muy limitado en el rango de caracteres. Asimismo se debe tener en cuenta que solo soporta los caracteres en idioma inglés, podría haber usado los caracteres ASCII extendidos que oscilaron entre 128 y 255. Debido a que el rango del código ASCII es de 0 a 255, puede caber dentro de 1 byte de datos.

El código HTML se basa en los diferentes conjuntos de caracteres que pueden ir desde un conjunto de caracteres de un solo byte, como Latin-1 (ISO-8859-1) o UTF-8, que utiliza varios bytes para representar un carácter. El uso de un conjunto de caracteres como UTF-8 nos proporciona una gama mucho mayor de conjuntos de caracteres.

Cuando se utiliza un navegador web, el sitio web que estamos utilizando normalmente especifica el conjunto de caracteres que está utilizando. Por ejemplo, en una página web HTML5 puede ver la cadena <meta charset = “utf-8”> en la fuente de la página. Esto le dice al navegador que los datos que se envían utilizan la tabla de caracteres UTF-8.

El código HTML generalmente está en el formato de & # 169. El & le dice al navegador que es un código HTML, lo cual no es un código que parte de una cadena. El # después de & le dice al navegador que lo siguiente es un valor numérico de un símbolo; Es decirle al navegador que es el final del código.

En el caso de & # 169, este es la representación del código de tipo HTML el cual se encarga de identificar el símbolo de copyright ©. Vaya a la Caja de herramientas de recursos para ver un rango de tablas de códigos HTML

¿Dónde utilizaría los códigos ASCII o HTML?

Utilizaría los códigos ASCII para toda la programación y las comunicaciones normales cuando use su Arduino, Rasperry Pi o cualquier plataforma que esté en uso. La única vez que lo haría con códigos HTML es si se está comunicando con un navegador web.

ASCII conocido así debido a que es una simplificación de un grupo de asociación de códigos, ampliamente utilizado para codificar documentos de texto en computadoras. Generalmente, un archivo descrito como “ASCII” no contiene ningún carácter de control incorporado especial; puede ver el contenido del archivo, cambiarlo con un editor o imprimirlo con una impresora.

En ASCII, cada letra, número y símbolo de puntuación tiene un número correspondiente, o código ASCII. Por ejemplo, el carácter para el número 1 tiene el código 49, la letra mayúscula A tiene el código 65 y un espacio en blanco tiene el código 32.

Este sistema de codificación no solo permite que una computadora almacene un documento como una serie de números, sino también le permite compartir dichos documentos con otras computadoras que utilizan el sistema ASCII.

Los archivos de documentación o los archivos de código fuente del programa generalmente se almacenan como texto ASCII. En contraste, los archivos binarios, como los programas ejecutables, las imágenes gráficas o los documentos de procesamiento de textos, contienen otros caracteres que normalmente no se pueden mostrar o imprimir, y generalmente son ilegibles para los seres humanos.

El formato de un archivo, ya sea ASCII o binario, se vuelve importante cuando está transfiriendo archivos entre computadoras. Por ejemplo, cuando usa FTP, puede transferir archivos de texto ASCII sin ninguna consideración especial.

Sin embargo, para intercambiar archivos binarios, es posible que deba ingresar el comando set binary o preparar al cliente para transferir archivos binarios, de modo que la computadora transmita correctamente los caracteres especiales en el archivo.

Los caracteres del ASCII

Los caracteres que corresponden al grupo ASCII estándar utilizan solo 7 bits para cada carácter. De igual forma a otro tipo de caracteres que se usan por ejemplo 8 bits, lo que les da 128 caracteres adicionales. Los caracteres adicionales se utilizan para representar caracteres no ingleses, símbolos gráficos y símbolos matemáticos.

Varias empresas y organizaciones han propuesto extensiones para estos 128 caracteres. Un súper conjunto de ASCII llamado ASCII extendido o ASCII alto. Un estándar más universal es el conjunto de caracteres ISO Latín 1, que es utilizado por muchos sistemas operativos, así como por los navegadores web. Otro conjunto de códigos que se usa en computadoras grandes de IBM es EBCDIC.

El conjunto de caracteres ASCII

Los datos de caracteres se representan en una computadora mediante el uso de códigos numéricos estandarizados que se han desarrollado. El código más aceptado es el Código Estándar ASCII. El código ASCII asocia un valor entero para cada símbolo en el conjunto de caracteres, como letras, dígitos, signos de puntuación, caracteres especiales y caracteres de control.

Algunas implementaciones usan otros códigos para representar caracteres, pero usaremos ASCII ya que es el más utilizado. Así como aquellos caracteres del ASCII y su representación de código decimal se muestran en la Tabla. Por supuesto, la representación interna de la máquina de los caracteres es en forma binaria equivalente.

Tabla ASCII

La tabla ASCII tiene 128 caracteres, con valores de 0 a 127. Por lo tanto, 7 bits son suficientes para representar un carácter en ASCII; sin embargo, la mayoría de las computadoras suelen reservar 1 byte (8 bits) para un carácter ASCII. Un byte permite un rango numérico de 0 a 255 que deja espacio para el crecimiento en el tamaño del conjunto de caracteres, o para un bit de signo.

En consecuencia, un tipo de datos de carácter puede representar opcionalmente valores con signo; sin embargo, por ahora, asumiremos que los tipos de datos de caracteres no están firmados, es decir, valores enteros positivos, en el rango de 0-127.

Observando la tabla, tenga en cuenta que los valores decimales de 0 a 31 y 127 representan caracteres de control no imprimibles. Todos los demás caracteres pueden ser impresos por la computadora, es decir, se muestran en la pantalla o se imprimen en impresoras, y se denominan caracteres imprimibles.

Todos los caracteres imprimibles y muchos de los caracteres de control pueden ingresarse en la computadora escribiendo las teclas correspondientes en el teclado.

La columna de caracteres muestra las teclas que se deben presionar. Un carácter imprimible; sin embargo, los caracteres de control necesitan teclas especiales en el teclado o requieren que se presione la tecla CTRL junto con otra tecla. En la tabla, una tecla de control se muestra con el símbolo ‘136. Así, ‘136Aes control-A, es decir, la tecla CTRL se mantiene presionada mientras se presiona la tecla, A.

Observe que el carácter ‘A’ tiene el valor de código de 65, ‘B’ tiene el valor de 66, y así sucesivamente. La característica importante es el hecho de que los valores ASCII de las letras ‘A’ a ‘Z’ están en una secuencia numérica creciente contigua.

 

Valores de la tabla

Los valores de las letras minúsculas ‘a’ a ‘z’ también están en una secuencia ascendente contigua que comienza en el valor de código 97. De manera similar, los caracteres de los dígitos ‘0’ a ‘9’ también están en una secuencia contigua creciente que comienza en el valor del código 48. Como veremos, esta característica del código ASCII es bastante útil.

Debe destacarse que un símbolo de dígito es un tipo de carácter. Los dígitos tienen valores de código que difieren de sus equivalentes numéricos: el valor de código de ‘0’ es 48, el de ‘1’ es 49, el de ‘2’ es 50, y así sucesivamente. La tabla muestra que el carácter con el valor de código 0 es un carácter de control, ‘136 @, llamado el carácter NULO. NO lo confunda con el símbolo del dígito ‘0’. Recuerde, un carácter de dígito y el número equivalente tienen diferentes representaciones.

Además de usar comillas simples, también es posible escribir constantes de caracteres en términos de sus valores ASCII en un programa C, usando sus valores octales o sus valores ASCII hexadecimales. Al escribir constantes de caracteres, el valor octal o hexadecimal sigue al carácter de escape, como se muestra en la Tabla.

Se necesitan como máximo tres dígitos octales o como máximo dos dígitos hexadecimales. Tenga en cuenta que, después de la barra diagonal inversa de escape, no debe incluirse un cero inicial al escribir números octales o hexadecimales.

Normas para el ACSII

Considerado como la representación de codificación de caracteres que se basa en el orden de los caracteres alfabéticos en el idioma inglés.

Las representaciones enteras ASCII tienen subconjuntos imprimibles y no imprimibles. Los caracteres imprimibles son caracteres normales y los no imprimibles son caracteres que se utilizan para representar las teclas del teclado, por ejemplo, retroceso, eliminación y retorno.

Estándar internacional

Técnicamente, ASCII es de 7 bits y representa solo 128 caracteres (0-127). El rango 0-31 son caracteres de control, con 32-127 que representan caracteres alfabéticos de la A la Z, así como todos los números del 0 al 9 (aunque no en ese orden). ASCII solo se puede utilizar para codificar el inglés de los Estados Unidos.

Algunas personas confunden los códigos por encima de 128-255 para ser ASCII, pero técnicamente hablando, no lo son. A medida que las computadoras evolucionaron, se hizo común usar un byte de 8 bits.

Este último carácter permitió 128 caracteres adicionales, lo que se conoce como ASCII extendido. Diferentes sistemas implementan ASCII extendido de manera diferente, por lo que hay problemas de compatibilidad que no se encuentran en los primeros 128 caracteres.

[simple-author-box]

1 comentario en “Para Qué Sirve y qué es el Código ASCII”

Deja un comentario