May 09, 2004

XML::Parserのエラー

GW初日から実装中のMT用のAmazonタグについて,商品の評価情報を取得するために,リクエストのタイプを「lite(情報量少)」から「heavy(情報量多)」に変更したら,以下のようなエラーがよく出るようになった.

not well-formed (invalid token) at line 1, column 34922, byte 50440 at /usr/lib/perl5/5.8.0/i386-linux-thread-multi/XML/Parser.pm line 185

調べてみると,SOAPレスポンスメッセージの中の「レビュー」部分に機種依存の文字が含まれているため,うまくparseできないようだ.

参考:
NDO::Weblog: XML::Parser が機種依存を解析できない問題
dh's memoranda: Comment on Movable Type 2.6 Japanese Language Pack
2003/07/15 自宅 『AWS: Amazon の「¥」マークに関するバグ』

エンコードは,しっかりUTF-8になっているようなので,以前あった¥問題と同じような問題なのかなあ….Expatのparse関数で落ちているようなのだけど,解決方法がちょっと思いつかない.

[追記(2004-05-09)]
この問題については,Amazon側でも認識済みらしい.
soap heavyでUTFDataFormatException

また,Amazonのレビューにも,ところどころ文字化けがある.

Amazon.co.jp: 本: 日本語の作文技術

文章を書くときだけでなく読んでいるときも、句読点の打ち方、修飾語、助詞の三点についてものすごく敏感になる。[ここから]気[ここまで]なりすぎて、本を読んだり、メールを送ったりするときに時間がかかりすぎるようになってしまうのが欠点といえば欠点かもしれない。とるに足らないことではあるけれども。

※字と同等以上に重要だと[ここから]心[ここまで]ける。
Posted by chopin at May 9, 2004 12:14 AM | |
「XML」に関連したオススメ(売り上げ順)はいかがですか?
10日でおぼえるXML入門教室 第2版
山田 祥寛,
Book(2004/10)翔泳社
★★★★☆
本のタイトルよりは高度な内容
★★★★★
とても分かりやすい
やさしいXML
高橋 麻奈,
Book(2001/06)ソフトバンクパブリッシング
★★★★★
XMLの実用的な初心者向け本です
★★★★☆
XMLマスターを目指して勉強する一歩手前で
基礎XML
山田 祥寛,
Book(2004/12)インプレス
★★★★★
練習問題が多くて嬉しい
実践ワークショップ InfoPath+XMLによるOffice2003連携プログラミング―究極のサンプル&Tips333の技
PROJECT KySS,
Book(2004/06)秀和システム
★★★★☆
最初のInfoPath解説本
Powered by AdAmazon