WordPress とphp、ファイル&文字のお話し

「1歩ずつ」は必ず目的地に着くのです

スポンサードリンク

WordPressで使われている php という拡張子のファイル -
ブログの更新や運用の中心と言えるサイトのデザインや使い勝手をまとめたテーマ。そのテーマに特有の機能やデザインをさらに自分の好みや必要に合わせてオプティマイズしたいと思うようになり、ファイルのバックアップをはじめとする必要な知識と技術を使えるようになろう…

そんな上級編は少し先のことかも知れません。
けれど遠い目標にも1歩ずつ、と思って、まずはファイル形式のことから始めましょう。

php というファイル形式と UTF-8 という文字コード

WordPressで使われているファイルの多くは php をはじめとしてほとんどが、UTF-8 LF という文字形式(正確な言葉ではなく分かりやすく言ってですが)で書かれています。

いっぱんにアルファベットを使う国の文字は1文字1バイト、日本語の全角文字は1文字2バイトと覚えていると思いますが、UTF-8 では漢字・かなを3バイトで書きます。ちょっと不思議な感じですよね。

そして “LF” は Line Feed の略。改行文字をどういう文字で表すかという意味です。”LF” はOSで言えば Unix, Linax, そしてMachintosh (MacOS) という OS で標準的に使われている改行文字で、1バイトで表します。それに対して “CR/LF” Carriage Return/Line Feed つまり、2バイトで改行文字を表す方式があるのです。Windows の間のOS、MS-DOS以降、一般的なWindows PCはこの改行コードを使っていると思えばいいだろうと思います。

今のWindowsはWYSWYGの発展形と言えばいいでしょうか、見たままに扱えるように機能してくれるものが多いので、見た目だけでは識別がつかないことが多いのです。
その様子を画像にしてみると下のようになります。

Difference of character
文字コードの違いとは
スポンサードリンク

3つの白いウィンドウはサクラエディタというソフトウェアの表示画像ですが、見た目では違いが分かりません。
つまりサクラエディタは、それぞれのファイルの内容をWindowsの標準文字にして見せてくれているのです。

その3つのファイルをWindowsがシステムツールとして持っているコマンドプロンプト、つまり同じ環境で表示してみるとすべて別々、3種類に違って見える、ということが分かると思います。
コマンドプロンプトはSJISで表示しているんだな、ということも分かりますね。

WordPress の中・上級レベルには、このファイル形式と文字形式の違いを理解して、その違いを使い分ける技術+ソフトウェアが必要だということを覚えておきましょう。

スポンサードリンク

返信を残す

メールアドレスが公開されることはありません。