SHIFT_JISやEUC_JPのファイルをUTF-8へと変換

SHIFT_JISやEUC_JPのファイルをUTF-8に変換するためのチュートリアルです。

1) 最初に、エンコードソフトを用意します。エンコードソフトは色々ありますが、今回はKaSHIMさんのKanjiTranslatorを使用します。ここからサイトへと飛び、KanjiTranslatorの項目の下にある『詳しくはこちら』をクリックしてください。そして、ダウンロードから『KanjiTranslator160.zip』をクリックし、ソフトを入手します。ZIP圧縮されているので、KanjiTranslator用のフォルダを作って、そこでソフトを解凍します。


2) 解凍後、KanjiTranslator.exeがでてくるので、そちらをダブルクリックし、ソフトを起動。すると、左の画像のような画面が表示されます。

3) ここで、サイトをUTF-8に一括変換してしまいたいところですが、その前に必ず、サイトのバックアップをしておきましょう。一括変換は便利ですが、一歩間違えると、取り返しの付かないことになります。わたしも、サイトが入っているフォルダをコピーしました。

4) バックアップをとったところで、サイトのフォルダをKanjiTranslatorにドラッグ&ドロップ。

5) ファイル名がリストアップされたら、変換先文字コードを『Shift_JIS』から『UTF-8(BOM無し)』にして、『変換』ボタンをクリックしてください。

6) ステータスが『□完了』となっていれば、一括変換成功です。もし、『■失敗』となっていたら、成功したファイルをどれでもいいのでコピーして、そのコピーをサクラエディタなどのUTF-8対応エディタで開き、失敗したファイルの内容をそのコピーに上書きしてください。上書きしたコピーのファイル名を変更するのを忘れずに。なお、画像、音楽やThumbs.dbファイルはUTF-8とは関係ないので『■失敗』が正常です。

7) ファイルをUTF-8にしたあとは、ブラウザがUTF-8と判別しやすいように、HTMLの一括タグ編集をします。こちらから、ページ順『ダウンロード>5.21』をクリックし、テキスト一括置換ソフト、TextSS.netをダウンロードします。こちらもZIP圧縮されているので、TextSS用のフォルダを作って、そこでソフトを解凍します。

8) 解凍すると『TextSS.net.exe』がでてくるので、そちらをダブルクリックしソフトを起動します。起動しない場合は『TextSS.net32.exe』の方をダブルクリックしてみてください。

9) はじめてTextSSを起動するとこのような画面が表示されます。サイトで日本語しか扱ってない場合は、上にチェックをしてもいいのですが、今回は万が一を考えて、下の方にチェックをして『決定』をクリックします。

10) 拡張子のところを『*.htm;*.html』から全ファイルを意味する『*.*』にします。もしcgiやphpなど、置き換えしたくない拡張子ファイルがある場合は、『*.*』ではなく『*.htm;*.html;*.css;*.js』と置き換えしたい拡張子だけを追加してください。

11) ここで心配な方はもう一度、サイトのバックアップコピーを作っておいてください。大丈夫なようなら、サイトのフォルダをTextSSにドラッグ&ドロップ。

12) 置き換えするファイルがリストアップされました。このとき、コードページ項目に赤文字でエラー、『Shift_JIS』、『EUC-JP』などが書かれてあっても、気にしなくて大丈夫です。このまま『次へ』をクリック。

13) 検索する文字列には現在のサイトの文字コードを入力。その下にある『大文字小文字を区別せずに照合を行う』にチェック。置換する文字列にはUTF-8を入力してください。終わったら『次へ』をクリック。

14) このまま何も設定せず、下の開始をクリックします。『置換を開始してよろしいですか?』とでるので『はい』をクリック。

15) 置き換えするファイルが多い場合、ひとつひとつファイルを確認している時間はないので、今回は『置換候補の確認』には『表示しない』にチェックします。そして『置換する』をクリック。「以降、すべて『置換する』でよろしいですか?」とでたら、"はい"をクリック。(ファイル数が少ない方は『表示する』で『ファイル全置換』を一回ずつクリックしていっても大丈夫です)。

16) ステータスが『置換完全成功』となっていれば、成功です。お疲れ様でした。このまま、TextSSを閉じて大丈夫です。以下は、CGIをUTF-8に変更したい方へのチュートリアルです。

17) CGIファイルがある方はもう一度、11番に戻り、13番でShift_JISだった方はSJIS。EUC-JPだった方はEUCと検索する文字列に入力してください。置換する文字列にはutf8を入力。そして、置換えをしてください。CGIでは文字エンコードを違うバージョンで表示することがあるので、念のため、再度置き換え作業をします。そして、CGIファイルにjcode.plがある方はこちらからjacode.pl 2.13.4.11をクリックし、サクラエディタなどのUTF-8対応ソフトでjcode.plを開き、中身をすべてjacode.plの物へと上書きしてください。これで、エンコード変換は終了です。お疲れ様でした。

inserted by FC2 system