PHP’ga vigaste märkide eemaldamine UTF-8 kodeeringus olevast XML failist

Juba mõnda aega teevad tõelist peavalu blogid mis hoolimata oma kuulutatavast UTF-8 kodeeringust mingil müstilisel põhjusel ka ISO formaadis (või mingeid muid müstilisi loetamatuid) märke sisaldavad. Kaks päeva otsimist, puurimist, katsetamist ja üks võimalikest lahendustest selline:


$data = iconv("UTF-8","UTF-8//ignore",$data);

Esmased testitulemused on positiivsed. Lisaks tuleb muidugi rakendada väga väikese asciikoodiga märkide eemaldamist.

Nõnda siis, edaspidi BlogEYE veelgi töökindlam:) Kui mingeid vigu jääb silma, siis andke aga teada.

Advertisements

Lisa kommentaar

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Muuda )

Twitter picture

You are commenting using your Twitter account. Log Out / Muuda )

Facebook photo

You are commenting using your Facebook account. Log Out / Muuda )

Google+ photo

You are commenting using your Google+ account. Log Out / Muuda )

Connecting to %s

%d bloggers like this: