|
Recepción
Antecedentes del proyecto
Libremail is not Outlook
Presentación general
Características técnicas
Ver las fuentes
Cargar a distancia
Instalación
Último fuentes
Derechos de utilización
Contactar el autor
Tee-shirts para sostener
Otros sitios web
Sitio web espejo
|
Características técnicas
Esta página de información es la menos accesible ciertamente de este
sitio web. Es necesario tener un conocimiento del formato de los
mensajes transmitidos por correo electrónico (en particular, la
codificación MIME (1)
(2)
(3))
para seguir todos los detalles.
Generalidades
Al origen, los protocolos Internet se desarrollaron para Estados
Unidos de América, antes de utilizarse en otros países.
Esta internacionalización requirió de tener en cuenta alfabetos más
ricos que el alfabeto americano.
Además, después de los textos básicos, los protocolos de correo
electrónico integraron la posibilidad de enviar textos con
compaginación y ficheros de toda clase.
Desgraciadamente, para cada problema encontrado, se adoptaron varias
soluciones técnicas distintas sin que, la mayor parte del tiempo, tal
diversidad presentara un interés práctico.
Por otra parte, la complejidad de las normas hace que no se respetan
a la carta por los mailers, tanto para dificultades de aplicación, o
a causa de puesta en práctica muy aproximative.
En la práctica, la mayoría de los mailers utilizan un subconjunto
limitado de los formatos de mensajes posibles.
Dos elecciones son pues posibles:
- o intentar tratar lo mejor posible todos los mensajes a riesgo de
realizar una aplicación muy compleja,
- o limitarse a los casos más corrientes (que pueden a pesar de
todo englobar un 99% de los mensajes).
Es el segundo enfoque que se adoptó para libremail.
No obstante, versión después de versión, libremail tratada cada vez
más casos particulares, sin sin embargo haber vuelto mucho más
complejo que al origen.
Tratamiento de los correos electrónicos recibidos en
función de su estructura
- Si el correo electrónico recibido se limita a una zona de texto de
tipo text/plain, Libremail indicará este texto.
- En el caso de mensajes multipart/alternative (en primer lugar del
texto luego el equivalente en HTML), libremail indicará la sección
texto del correo electrónico.
- Si el correo electrónico está en HTML puro (text/html), libremail no
hace conversión para indicar legiblemente esta clase de mensaje.
Por contra, la herramienta suphtm es capaz de detectar y suprimir
antes del cobro a distancia los mensajes en HTML puro.
- Si un correo electrónico es de tipo multipart/aplazamiento, libremail
indicará las distintas zonas de texto que contiene las unas a la
consecuencia de los otros.
No hay búsqueda de ficheros adjuntados en los correos electrónicos
de tipo multipart/report.
- En el caso de un correo electrónico de tipo multipart/mixed,
libremail indicará el texto contenido en la primera sección.
Según el caso, será:
- el texto contenido en una sección de tipo text/plain,
- lo bajo sección text/plain de una sección multipart/alternative,
- el texto no convertido de la sección text/html si no hay sección
text/plain
Tras esta visualización, libremail añadirá la lista de los ficheros
adjuntos que podrán recuperarse. Las secciones text/html, poseyendo
un nombre de fichero, no obstante no se tendrán en cuenta (desde la
versión 1.2.1).
Si el correo electrónico contiene secciones message/rfc822, estos
últimos se tratarán como correos electrónicos, y se añadirá su texto
al del correo electrónico principal.
Por contra, si se indicará un correo electrónico de tipo
multipart/mixed implica varias zonas de texto sucesivas, solamente la
primera.
En un correo electrónico multi sección, se puede elegir (desde la
versión 1.1.0) indicar la sección text/html (sin conversión de las
balizas) al lugar de la sección text/plain.
Las secciones multipart/related tiene a figurante al interior de
otras secciones multipart en cuenta (desde la versión 1.2.1) para el
tratamiento de los bordes de secciones, sin por ello que su presencia
no implica cambios en el análisis del correo electrónico.
Estructura de los mensajes enviados
Para el envío de correos electrónicos, libremail se limita a dos
estructuras de mensaje solamente:
- correo electrónico constituido solamente de una sección texto de
tipo text/plain
- correo electrónico de tipo multipart/mixed compuestos de una sección
text/plain seguido de uno o más ficheros adjuntos.
Codificación de los caracteres
Como se precisa más arriba, los protocolos Internet en primer lugar
fueron americanos antes de internacionalizarse. Ahora bien, los
americanos poseen 2 características que los distinguen de la mayoría
del pueblo del planeta:
- poseen unas existencias desproporcionados de armas de destrucción
masiva,
- su lengua no implica acentos.
Para el correo electrónico, es el 2.o punto que es el más importante,
en particular, p que al origen, los protocolos Internet han estado
previstos para una transmisión de los caracteres sobre 7 bites.
En estas condiciones los caracteres que tenían el 8.o bit
significativo (es decir, a 1) debían cifrarse.
Por otro lado, incluso hoy dónde la transmisión de los caracteres
sobre 8 bites se ha generalizado, la norma de transmisión prevé que
se cifrarán los caracteres del encabezamiento de los mensajes que
tendrán el 8.o bit significativo colocado siempre.
Dos formatos de codificación existen: el formato "quoted printable"
y el formato base64.
- Para la visualización de los campos del encabezamiento de los
mensajes, libremail soporta desde el principio la codificación quoted
printable (casi universal) y desde la versión 1.0.4 la codificación
base64 (mucho más raro y sin interés practico con un alfabeto
europeo, si no puede ser el impedir una visualización legible por
mailers antiguos, y complicar el filtrado de los correos electrónicos
directamente por el servidor de servicio de mensajería a partir del
campo Subject:).
- Para la visualización del contenido recibidos mensajes, libremail
acepta desde el principio los textos transmitidos directamente sobre
7 ó 8 bites (sin codificación visible a la recepción), y los mensajes
cifrados al formato quoted printable.
Los mensajes cifrados base64 se convierten ahora (desde la versión
1.1.0), pero con un tratamiento de los saltos de línea más
rudimentaria que para los otros formatos. Por toda manera, el empleo
de esta codificación para los textos de los correos electrónicos es
muy raro, y completamente injustificado con un alfabeto europeo.
- Para la recuperación de los ficheros adjuntos, las codificaciones
quoted printable y base64 ambos se convierte desde el principio, (lo
que es el menor de las cosas).
- Para el envío de correos electrónicos, libremail realiza
automáticamente una codificación quoted printable de los campos del
encabezamiento que contienen caracteres especiales, mientras que el
cuerpo de los mensajes es transmitió bajo 8 bites y en consecuencia,
sin codificación.
- Para enviar ficheros adjuntos, en función del contenido de estos
ficheros, Libremail elige entre la codificación quoted printable y la
codificación base64, el que es el menos incómodo.
Estas opciones técnicas convienen perfectamente en los países
desarrollados (por ejemplo Francia), pero no son pueden no adaptarse
a otras regiones del mundo como África (a comprobar).
Si resultaba que en estos países, los caracteres acentuados se
transmitan correctamente en los campos de encabezamiento (en
particular, en el tema del correo electrónico), y en los documentos
adjuntos, pero no en el texto del mensaje, sería necesario crear y
utilizar una versión modificada de "envmail" para que estos mensajes
se transmitan con la codificación quoted printable .
Juegos de caracteres reconocidos
- Al origen, se concibió a Libremail para trabajar con el juego de
caracteres por defecto ISO-8859-15 o ISO-8859-1 cuando el símbolo
€ (euro) no es necesario.
Puede pues indicar bien sin conversión los correos electrónicos
resultantes de un PC que funcionan también bajo Windows (hasta a la
versión 98), que bajo algunas distribuciones de GNU/Linux y de otro
UNIX.
- Se convierte un subconjunto de los caracteres (no affichables en
el estado) incluidos entretanto 80h a 9Fh (utilizado, en particular,
sobre Mac) en su equivalente en el juego ISO-8859-15.
- Libremail detecta también la codificación UTF-8 y convierte los
caracteres correspondientes cuando son equivalentes a un carácter
presente entretanto A0h a FFh del juego ISO-8859-15.
No se convierten los que corresponden a un carácter del intervalo 80h
a 9Fh en este juego ISO. Por una parte se conseguiría caracteres no
affichables, el otros va su codificación UTF-8 es mucho más anárquica
que el de los caracteres con A0h.
Sin embargo, otros caracteres UTF-8, probablemente de los caracteres
tipográficos Mac, también se convierten cuando es posible.
- Desde la versión 2.0 (y las betas versiones 1.9.2 y 1.9.3),
Libremail analiza la variable de medio ambiente # para detectar el
juego de caracteres (ISO-8859-n o UTF-8) utilizado por el sistema de
explotación.
Los correos electrónicos redactados con el mismo juego de caracteres
que el del sistema de explotación se indican sin conversión, se
convierten los otros de ISO-8859-1 a UTF-8 o UTF-8 a ISO-8859-15 para
permitir una buena visualización de los caracteres acentuados.
De la misma forma, la introducción de los correos electrónicos puede
hacerse también bien con el juego de caracteres ISO-8859-15 que el
juego de caracteres UTF-8 .
- La codificación UTF-7 no es tratada por libremail.
Hora y zona horaria
Para la visualización de las fechas y horas de expedición de los
mensajes, Libremail tiene en cuenta la tendencia mayoritaria en los
países de la Europa del oeste, es decir:
- el ordenador que envía el correo electrónico se regula (con algunos
minutos) sobre la hora local,
- la zona horaria declarada puede ser no importa la cual.
Los correos electrónicos recibidos se indican pues con la hora de
expedición que contienen sin hacer corrección al nivel de la zona
horaria.
Para las regiones del mundo donde un mismo país se recorta en varias
zonas horarias, otras opciones técnicas en esta visualización pueden
ser preferibles.
|