文字コードについて

コンピュータは文字コードという数値で文字を処理しています.日本語を扱う上でいつもついてまわる問題が文字コードの処理方法です.

文字コード

もともとコンピュータはアルファベットを使う国,アメリカで作られたので,日本語のようにひらがな,カタカナ,そしてたくさんの漢字を使うようには出来ていませんでした.アルファベットと数字なら1バイトあれば事足りますから.

でも日本人にとって,アルファベットと数字しか使えないコンピュータなんて不便でしょうがありません.日本語のように文字の種類が多いと一文字を表すのに2バイト以上が必要になります.それにはいろいろと困難が伴うのですが,さまざまな工夫で日本人はつぎの方法を編み出しました.

詳しいことは置いておいて,現在パソコンなどで使われているものは

がメインです.シフトJISコードはWindowsやMac OSの標準コードとして,7ビットJISコードはメールなどに,EUCコードはLinux系OSで多く使われています.

改行コード

改行を表すのに用いられるコードが改行コードです.違うOSでつくったテキストファイルをエディタで開くと,改行がなくて読みずらかったりします.これは日本語の問題ではなく, OSによって採用している改行コードが異なるために起こります.

各OSで使われている文字コード

日本語文字コードと改行コードは OS によって少し異なっており,つぎのようになっています.

OS(主な)日本語文字コード改行コード改行コード(16進)改行コード(10進)
LinuxEUC-JPLF0A10
WondowsShift_JISCR+LF0D 0A13 10
MacintoshShift_JISCR0D13

例えば Linux で作ったファイルを Windows で使う場合は,文字コードを EUC-JP から Shift-JIS に,改行コードを LF から CR+LF にすればいいことがわかります.

Valid XHTML 1.1! home > コンピュータ > Tips集 >
リロード   新規 編集 凍結 差分 添付 複製 改名   トップ 一覧 検索 最終更新 バックアップ   ヘルプ   最終更新のRSS
Modified by 物理のかぎプロジェクト PukiWiki 1.4.5_1 Copyright © 2001-2005 PukiWiki Developers Team. License is GPL.
Based on "PukiWiki" 1.3 by yu-jiPowered by PHP 5.3.29HTML convert time to 0.009 sec.