投稿日 | : 2006/11/09(Thu) 16:14 |
投稿者 | : 魔界の仮面弁士 |
Eメール | : |
URL | : |
タイトル | : Re: テキストから文字を取得したいのですが |
> 読み込んでいるのですが、その場合㎥(立方メートル)u(平方メートル)等が?で表示
> されてしまいます。
まず、それらの文字は、Unicode テキストファイル上では、どのようなバイナリ値になっていますか?
また、化ける件に関しては、Stream に取り込んだ際に、既に化けているのでしょうか。
それとも、Stream にまでは正常に取り込まれているものの、それを表示するときに
化けているのでしょうか?
もし、Shift_JIS 環境への表示時に化けるという状況だとしたら、立方メートルは、
Shift_JIS : 該当なし
Unicode : U+33A5
なので仕方ないにしても、平方メートルは、
Shift_JIS : 0x8775
Unicode : U+33A1
のようにマッピングされているので、通常は化ける事はないかと思います。
> HTMLファイルを作成するプログラムを作っています。
作成する HTML ファイルの文字コードは何を採用されているのでしょうか。
もしも UTF-8 以外での出力を行っているのであれば、それらの文字を、
「㎥」「!a5;」「蝵」「㎡」などの数値参照で行うようにした上で、
必要に応じて lang 属性の指定や、CSSによるフォントの指定まで行うようにすれば、
一応の回避はできるような気がします。