Hoe e-pos kliënte berg pos op jou hardeskyf
Die mees algemene formaat vir die stoor van pos boodskappe is die mbox-formaat. MBOX staan vir MailBOX. 'N Mbox is 'n enkele lêer met nul of meer e-posse.
Die mbox-formaat
As ons die mbox-formaat gebruik om e-posse op te slaan, sit ons almal in een lêer. Dit skep min of meer lang teks lêer (Internet-e-pos bevat altyd net as 7-bis ASCII-teks, al die ander - byvoegings, byvoorbeeld - is geïnkripteer ) wat een e-pos boodskap na die ander bevat. Hoe weet ons waar die een eindig en die ander begin?
Gelukkig het elke e-pos ten minste een Van-lyn aan die begin. Elke boodskap begin met "Van" (Van gevolg deur 'n wit spasie karakter, ook 'n "From_" -lyn genoem). As hierdie volgorde ('Van') aan die begin van 'n reël voorafgegaan word deur 'n leë lyn of bokant die lêer, het ons die begin van 'n boodskap gevind.
So waarna ons soek wanneer u 'n mbox-lêer ontleed, is in wese 'n leë lyn gevolg deur 'Van'.
As 'n gereelde uitdrukking kan ons dit skryf as "\ n \ nVan. * \ N". Slegs die heel eerste boodskap is anders. Dit begin slegs met 'From' aan die begin van 'n reël ("^ Van. * \ N").
& # 34; Vanaf & # 34; in die liggaam
Wat as die presiese volgorde hierbo in die hoofstuk van 'n e-pos verskyn? Wat as die volgende deel van 'n e-pos is?
... Ek stuur jou die mees onlangse verslag.
Uit hierdie verslag hoef jy nie te ... nie
Hier het ons 'n leë lyn gevolg deur 'Van' aan die begin van die reël. As dit in 'n mbox-lêer voorkom, het ons onmiskenbaar die begin van 'n nuwe boodskap. Ten minste is dit wat die parser dink - en hoekom beide die e-poskliënt en ons baie verwar sal word deur 'n e-pos wat geen sender of ontvanger bevat nie, maar begin met "Van hierdie verslag".
Om sulke rampspoedige toestande te vermy, moet ons seker maak dat "Van" nooit verskyn aan die begin van 'n reël wat 'n leë lyn in die inhoud van 'n e-pos volg nie.
Wanneer ons 'n nuwe boodskap by 'n mbox-lêer voeg , soek ons sulke reekse in die liggaam en vervang "Van" met "> Van". Dit maak verkeerde interpretasies onmoontlik. Die voorbeeld hierbo lyk nou so en stel die parser nie meer uit nie:
... Ek stuur jou die mees onlangse verslag.
> Uit hierdie verslag hoef jy nie te ... nie
Daarom vind jy soms '> From' in 'n e-pos waar jy net 'From' verwag.