タイトル : Re^2: 文字コードを変換 投稿日 : 2008/05/03(Sat) 10:46 投稿者 : ゆうき
ゆうきです。 魔界の仮面弁士さん回答ありがとうございます。 > Unicode メール等で良く使われるエンコードは、主に UTF-8 ですし、 > OLE/COM の文字列や、Win32 の 〜W 系 API などで利用されるのは、 > UTF-16 の BOM 無しリトルエンディアン。その他 UTF-7、UTF-16BE、 > UTF-32 など、幾つかの種類があります。使いたいのはどれですか? 実はよくわからないんです。 RSSを読み込むソフトを作っていて、RSSのXMLを書き出すのは 自分ではなく、別のソフトなので、どのエンコードで 書き出しているのかすらわからないのです。 > > XMLから読み込んで、読み込んだテキストを表示すると、 > XML の読み込みなら、System.Xml 名前空間のクラス(XmlDocument等)に > 任せるべきかと。正しい文字コードを自動判定して読み込んでくれますよ。 外部(インターネットからダウンロードしたソースファイル)を使って XMLを読み込んでいます。なので、XmlDocumentクラスは使えません。 そのソースファイルで読み込んでいるので何のエンコードで読み込んでいるか もわかりません。 > > 文字化けしてしまいます。 > どの文字が、どのように化けてしまうのでしょうか? E217・n・・・{・・・・E・・・・・・・@・X・V・H・・・I・・ 209・n・・・l・・・k・・・E・・・・・・@・a・J・・ こんな感じです。 > 元の「テキスト」は、既に「文字列(String)」として取得済みなのですよね。 > であれば文字コード変換の出番は、もはや無さそうに思えるのですが…。 そうですか・・・ やはりやり方が間違っていたのですね。 > そもそも、文字列として既にデコードされているものを、 > わざわざ UTF-8 バイナリにエンコードしなおして、 > そこからさらに、UTF-8 → Shift_JIS へとコーディング変換し、 > そうして得られた Shift_JIS バイナリを文字列に再デコードして > いるようですが、それ自体、意味のある作業には見えません。 では、どのようにすれば文字コードを変換できるのでしょうか。 わかりにくくてすみません。 よろしくお願いします。 |