Формат на mbox

Како е-пошта клиенти чуваат пошта на вашиот хард диск

Најчестиот формат за складирање на поштенските пораки е формат mbox. MBOX се залага за MailBOX. Mbox е единствена датотека која содржи нула или повеќе поштенски пораки.

Формат на mbox

Ако го користиме формат mbox за чување на пораки, сите ги ставаме во една датотека. Ова создава повеќе или помалку долга текстуална датотека (интернет-мејл секогаш постои само како 7-битен ASCII текст, сè друго - прилози, на пример - се кодирани ) кои содржат една е-порака по друга. Како да знаеме каде се завршува и почнува друго?

За среќа, секој е-пошта има барем еден Од-линија на самиот почеток. Секоја порака започнува со "Од" (Од проследено со знак за бел простор, исто така наречен линија од "From_"). Ако оваа секвенца ("Од") на почетокот на линијата претходи празна линија или е на врвот на датотеката, го пронајдовме почетокот на пораката.

Значи, она што го бараме кога парсирањето на датотека mbox е, во суштина, празна линија проследена со "Од".

Како регуларен израз, можеме да го напишеме ова како "\ n \ nОд. * \ N". Само првата порака е различна. Таа започнува само со "Од" на почетокот на линијата ("^ Од. * \ N").

& # 34; Од & # 34; во телото

Што ако токму горната секвенца се појавува во телото на е-порака? Што ако следново е дел од е-пошта?

... Ви го испраќам најновиот извештај.

Од овој извештај, не треба да ...

Тука, имаме празна линија, проследена со "Од" на почетокот на линијата. Ако ова се појави во датотека mbox, ние непогрешливо го имаме почетокот на нова порака. Барем тоа е она што го разгледува парсерот - и зошто и клиентот на е-пошта, и ние би бил сосема збунет од е -порака која не содржи ниту испраќач ниту примач, туку започнува со "Од овој извештај".

За да избегнеме такви катастрофални услови, треба да бидеме сигурни дека "Од" никогаш не се појавува на почетокот од линијата по празна линија во телото на е-пошта.

Секогаш кога ќе додадеме нова порака во датотека mbox , бараме такви секвенци во телото и едноставно ќе го замениме "From" со "> From". Ова ги прави неточни толкувања невозможни. Примерот погоре сега изгледа вака и повеќе не го активира парсерот:

... Ви го испраќам најновиот извештај.

> Од овој извештај, не треба да ...

Ова е причината зошто понекогаш може да најдете "> Од" во е-пошта каде што би очекувале само "Од".