nekur.lv fīdparsēšana
Kamēr fīdburneristi skatās no savas puses, kur ir (varētu būt) problēma, šķiet, ka būs jārīkojas kardināli un jāprovē uzķert brīdis, kad tas notiek.
if (substr_count($item['title'] . $item['content'] . $item['description'], '??') >= 4) { $LOG->warning(' Ignored. Probably invalid UTF8'); $badfile = dirname(__FILE__) . '/data/bad/' . basename($file); mail($config->get('developers list'), '[feedparser] Problems with encoding in ' . $file, 'Copied to ' . $badfile); if (copy($file, $badfile) === false) { $LOG->warning(' Damned. Could not copy ' . $file . ' to ' . $badfile); } continue; }
2008. gada 29. janvārī, plkst. 11:30
Interesanta UTF8 pārbaude. :)
2008. gada 29. janvārī, plkst. 14:14
Jep, kapēc substr_count vietaa neizmantot mb_detect_encoding ? - slinkums pielikt mb_string extensiju?
Parokoties pa php.net forumu, atrodas smuka alternatīva
function detectUTF8($string) { return preg_match('%(?: [\xC2-\xDF][\x80-\xBF] # non-overlong 2-byte |\xE0[\xA0-\xBF][\x80-\xBF] # excluding overlongs |[\xE1-\xEC\xEE\xEF][\x80-\xBF]{2} # straight 3-byte |\xED[\x80-\x9F][\x80-\xBF] # excluding surrogates |\xF0[\x90-\xBF][\x80-\xBF]{2} # planes 1-3 |[\xF1-\xF3][\x80-\xBF]{3} # planes 4-15 |\xF4[\x80-\x8F][\x80-\xBF]{2} # plane 16 )+%xs', $string); }
2008. gada 29. janvārī, plkst. 14:32
MC_, tāpēc, ka man ir jāizķer gļukainie transkodingi. TB - kad xml parseris netiek galā ar utf-8 dažādu iemeslu dēļ un pārtaisa tos par "????". Kas arī ir jautājuma zīmes.
2008. gada 29. janvārī, plkst. 16:54
A ja nu tiks parsēts kāds pokemonu blogs? Tur jautājuma zīmes būs sastopamas krieeetni biežāk :>
2008. gada 29. janvārī, plkst. 17:02
fest: šis ir īslaicīgs risinājums.
2008. gada 29. janvārī, plkst. 23:15
Es jau neko, bet esmu šo novērojis arī laacz.lv. Tā kā esmu diezgan drošs, ka problēma irfeedburner pusē. ;) Pie tam - kad tas notiek, tas notiek uzreiz visiem topikiem, ne tikai vienam.
2008. gada 1. februārī, plkst. 01:36
Hm, nu tā īsti nopietni neesmu ķēpājies ar PHP, bet tas ir saistībā ar manis iepriekš jautāto, kādēļ @nekur.lv parādās visi tie rakstu duplikāti, kas regoti uz FīdBurnera? :)
2008. gada 14. martā, plkst. 15:09
Cik sapratu, tad to fīdu fīdburneris iedod gļukainu, bet pēc kāda laiciņa tas gļuks pazūd? Ja? Ja tā ir, tad kāpēc nevarētu nekur.lv engīnei pateikt, lai nesmuko fīdu neizliek tautās, bet pārbauda vēlreiz pēc 5 minūtēm?