Ir al contenido

Codificación y número de caracteres

Generalmente, el texto del SMS tiene que ser transferido con codificación UTF-8 (y posiblemente con codificación urlen) a la pasarela. Tienes la opción de utilizar el parámetro “encoding” para decidir si quieres enviar un SMS normal de 7 bits o UCS-2 SMS.

Alfabeto estándar GSM de 7 bits (GSM 03.38)

Sección titulada «Alfabeto estándar GSM de 7 bits (GSM 03.38)»

El juego de caracteres básico contiene todos los caracteres que pueden transmitirse con un SMS normal de 7 bits. Cada uno de estos caracteres cuenta como 1 carácter. El juego de caracteres ampliado también puede transferirse, pero requiere 2 caracteres para su transmisión. Los SMS que contienen más de 160 caracteres se envían al teléfono como varios SMS, cada uno con 153 caracteres, y el teléfono los concatena en un solo mensaje.

Basic Character Set

0x000x100x200x300x400x500x600x70
0x00@ΔSP0¡P¿p
0x01£_!1AQaq
0x02$Φ2BRbr
0x03¥Γ#3CScs
0x04èΛ¤4DTdt
0x05éΩ%5EUeu
0x06ùΠ&6FVfv
0x07ìΨ7GWgw
0x08òΣ(8HXhx
0x09ÇΘ)9IYiy
0x0ALFΞ*:JZjz
0x0BØESC+;KÄkä
0x0CøÆ,<LÖlö
0x0DCRæ-=MÑmñ
0x0EÅß.>NÜnü
0x0FåÉ/?O§oà
  • LF es un control de avance de línea.
  • CR es un control de retorno de carro, o relleno.
  • ESC es un control de Escape.
  • SP es un carácter de espacio.

Ampliación del juego de caracteres básicos

0x000x100x200x300x400x500x600x70
0x00
0x01
0x02
0x03
0x04^
0x05
0x06
0x07
0x08{
0x09}
0x0AFF
0x0BSS2
0x0C[
0x0DCR2~
0x0E]
0x0F|
  • FF es un control de salto de página. Si no se reconoce, se tratará como LF.
  • CR2 es un carácter de control. No se codificará ningún carácter codificado en esta posición.
  • SS2 es un segundo control Single Shift Escape reservado para futuras ampliaciones.

Con UCS-2 es posible transmitir 1.112.064 caracteres. Estos caracteres representan casi todos los idiomas hablados. Cada carácter cuenta como 1 carácter, pero Unicode SMS sólo puede constar de 70 caracteres, o consistir en múltiples SMS concatenados, cada uno con 67 caracteres.

Por razones técnicas, con un sms sólo se pueden transferir 160 caracteres de texto (70 caracteres de texto Unicode). Si envía un SMS con más caracteres, se envía un SMS concatenado. Excesivamente largo Los mensajes de texto / Multi-SMS (SMS concatenados, SMS largos) son mensajes parciales y se transmiten por separado. Cada parte es un mensaje de texto independiente. El receptor vuelve a convertir las partes en un texto coherente. Para determinar que el mensaje es un mensaje concatenado y qué parte pertenece a qué parte se necesitan 7 caracteres (o 3 en Unicode) de los caracteres disponibles. Esta es la razón por la que una parte de un SMS demasiado largo sólo puede constar de 153 caracteres (o 67 en Unicode) de su texto. El máximo es de 1530 caracteres con un mensaje concatenado (o 670 caracteres para Unicode).