投稿日 | : 2002/11/21(Thu) 15:20 |
投稿者 | : 魔界の仮面弁士 |
Eメール | : |
URL | : |
タイトル | : Re: 追加質問 壁にぶちあたりました! |
> 読もうとしているhtmlが日本語EUCらしく文字化けしてしまってます。
Charsetプロパティを"euc-jp"に設定したStreamオブジェクトを使えば、
問題なく読む事ができると思います。
もしくはMSHTML.DLLを使って、htmlファイルからタグの抽出や修正等を行うこともできます。
> 日本語JISにエンコードしてから読むことってできるのでしょうか?
日本語JIS、と言っても、幾つか種類がありますが。。
http://www.ffortune.net/comp/develop/data/nihogojis.htm
Streamオブジェクトで変換できる文字コードは幾つかありますが、
標準でサポートされている物の中で、日本語を表示できるCharsetとなると、
"euc-jp" "ISO-2022-JP" "Shift_JIS" "UTF-8" "UTF-7" "Unicode" などですね。