PHP’ga vigaste märkide eemaldamine UTF-8 kodeeringus olevast XML failist

Juba mõnda aega teevad tõelist peavalu blogid mis hoolimata oma kuulutatavast UTF-8 kodeeringust mingil müstilisel põhjusel ka ISO formaadis (või mingeid muid müstilisi loetamatuid) märke sisaldavad. Kaks päeva otsimist, puurimist, katsetamist ja üks võimalikest lahendustest selline:


$data = iconv("UTF-8","UTF-8//ignore",$data);

Esmased testitulemused on positiivsed. Lisaks tuleb muidugi rakendada väga väikese asciikoodiga märkide eemaldamist.

Nõnda siis, edaspidi BlogEYE veelgi töökindlam:) Kui mingeid vigu jääb silma, siis andke aga teada.

Advertisements

Lisa kommentaar

Täida nõutavad väljad või kliki ikoonile, et sisse logida:

WordPress.com Logo

Sa kommenteerid kasutades oma WordPress.com kontot. Logi välja / Muuda )

Twitter picture

Sa kommenteerid kasutades oma Twitter kontot. Logi välja / Muuda )

Facebook photo

Sa kommenteerid kasutades oma Facebook kontot. Logi välja / Muuda )

Google+ photo

Sa kommenteerid kasutades oma Google+ kontot. Logi välja / Muuda )

Connecting to %s

%d bloggers like this: