少々見にくいでしょうか?

WordPressで使われている php という拡張子のファイル - テーマ純正の機能やデザインを自分の好みや必要に合わせたいと思うようになってきて、ファイルのバックアップをはじめとする必要な知識と技術を重ねることができたら、手を加えられるようになる日も来るかも知れませんが…

そんな上級編は少し先のことかも知れませんが、ファイル形式のことを少し書いておこうと思います。

 

php というファイル形式と UTF-8 という文字コード

WordPressで使われているファイルの多くは php をはじめとしてほとんどが、UTF-8 LF という文字形式(正確な言葉ではなく分かりやすく言ってですが)で書かれています。

いっぱんにアルファベットを使う国の文字は1文字1バイト、日本語の全角文字は1文字2バイトと覚えていると思いますが、UTF-8 では漢字・かなを3バイトで書きます。ちょっと不思議な感じですよね。

そして “LF” は Line Feed の略。改行文字をどういう文字で表すかという意味です。”LF” はOSで言えば Unix, Linax, そしてMachintosh (MacOS) という OS で標準的に使われている改行文字で、1バイトで表します。それに対して “CR/LF” Carriage Return/Line Feed つまり、2バイトで改行文字を表す方式があるのです。Windows の間のOS、MS-DOS以降、一般的なWindows PCはこの改行コードを使っていると思えばいいだろうと思います。

今のWindowsはWYSWYGの発展形と言えばいいでしょうか、見たままに扱えるように機能してくれるものが多いので、見た目だけでは識別がつかないことが多いのです。
その様子を画像にしてみると下のようになります。

スポンサードリンク
Difference of character

文字コードの違いとは

3つの白いウィンドウはサクラエディタというソフトウェアの表示画像ですが、見た目では違いが分かりません。
つまりサクラエディタは、それぞれのファイルの内容をWindowsの標準文字にして見せてくれているのです。

その3つのファイルをWindowsがシステムツールとして持っているコマンドプロンプト、つまり同じ環境で表示してみるとすべて別々、3種類に違って見える、ということが分かると思います。
コマンドプロンプトはSJISで表示しているんだな、ということも分かりますね。

WordPress の中・上級レベルには、このファイル形式と文字形式の違いを理解して、その違いを使い分ける技術+ソフトウェアが必要だということを覚えておきましょう。