tohokuaikiのチラシの裏

技術的ネタとか。

MicrosoftのHTML WorkshopでCHMを作る際の他言語における注意

もはやこの時代にHELP1を作ることなんてないのかもしれないですが、HTML Wordshopを使ってHELPファイルを作った時にハマったメモ。

日本語の場合は、Shift_JISにしてしまってガツッと作ったのですが、中国語に翻訳してもらったものをCHMにしようとしたらハマった。

文字コード

日本語の場合はShift_JISなのだけど、中国語の場合は、PHPでいうところのEUC-CNを使う。HTMLのメタタグでいうGB2312。

ただ、翻訳してもらった原稿がUTF-8で書いているのでUTF-8EUC-CNの変換にあたってない文字が存在することがある。それがとても大変なので、本文のHTMLだけはUTF-8のままにする。

HHKファイルとHHCファイル

この2つはUTF-8のHTMLから抜き出して要約を作るのだけど、UTF-8のままだと中国語で出したときに文字化けするので、EUC-CNにしておく。

この時点でいくつか文字化けが発生する。ただし、この見出しレベルの文字化けは頑張って対応する。

コンパイル

コンパイルは中国語のWindowsで行う。
これをしないと、キーワードファイルが文字化けしたままになる。

まとめ

文字化けを頑張って対応したり、コンパイルを中国語OSで行ったりと、全然一般的ではないのだけど、とりあえずこの方法で中国語Windowsで見たときに見られるようになったのでOKとする。なんというバッドノウハウ