HTMLエンコーディング(文字セット)
HTMLページを正しく表示するには、Webブラウザは使用する文字セットを認識している必要があります。
ASCIIからUTF-8へ
ASCIIは最初の文字エンコーディング標準です。ASCIIは、インターネットで使用できる128種類の文字(数字(0~9)、英字 (A~Z)、および ! $ + - ( ) @ < >)を定義しています。
ISO-8859-1は、HTML4のデフォルトの文字セットでした。この文字セットは、256の異なる文字コードをサポートしていました。HTML4はUTF-8もサポートします。
ANSI(Windows-1252) は、オリジナルのWindows文字セットです。ANSIはISO-8859-1と同じですが、ANSIには32文字が追加されています。
HTML5仕様では、Web開発者がUTF-8文字セットを使用することを推奨しています。この文字セットは、世界中のほぼすべての文字と記号をカバーしています!
HTML charset属性
HTMLページを正しく表示するには、Webブラウザはページで使用されている文字セットを認識している必要があります。
これは<meta>タグで指定されます。
文字セットの違い
次の表に、上記の文字セットの違いを示します。
| Numb | ASCII | ANSI | 8859 | UTF-8 | 説明 |
|---|---|---|---|---|---|
| 32 | スペース | ||||
| 33 | ! | ! | ! | ! | エクスクラメーションマーク |
| 34 | " | " | " | " | クォーテーションマーク |
| 35 | # | # | # | # | 番号記号 |
| 36 | $ | $ | $ | $ | ドル記号 |
| 37 | % | % | % | % | パーセント記号 |
| 38 | & | & | & | & | アンパサンド |
| 39 | ' | ' | ' | ' | アポストロフィ |
| 40 | ( | ( | ( | ( | 左括弧 |
| 41 | ) | ) | ) | ) | 右括弧 |
| 42 | * | * | * | * | アスタリスク |
| 43 | + | + | + | + | プラス記号 |
| 44 | , | , | , | , | コンマ |
| 45 | - | - | - | - | ハイフンマイナス |
| 46 | . | . | . | . | 終止符 |
| 47 | / | / | / | / | スラッシュ |
| 48 | 0 | 0 | 0 | 0 | 数字のゼロ |
| 49 | 1 | 1 | 1 | 1 | 数字の1 |
| 50 | 2 | 2 | 2 | 2 | 数字の2 |
| 51 | 3 | 3 | 3 | 3 | 数字の3 |
| 52 | 4 | 4 | 4 | 4 | 数字の4 |
| 53 | 5 | 5 | 5 | 5 | 数字の5 |
| 54 | 6 | 6 | 6 | 6 | 数字の6 |
| 55 | 7 | 7 | 7 | 7 | 数字の7 |
| 56 | 8 | 8 | 8 | 8 | 数字の8 |
| 57 | 9 | 9 | 9 | 9 | 数字の9 |
| 58 | : | : | : | : | コロン |
| 59 | ; | ; | ; | ; | セミコロン |
| 60 | < | < | < | < | 小なり記号 |
| 61 | = | = | = | = | 等号 |
| 62 | > | > | > | > | 大なり記号 |
| 63 | ? | ? | ? | ? | 疑問符 |
| 64 | @ | @ | @ | @ | アットマーク |
| 65 | A | A | A | A | ラテン大文字 A |
| 66 | B | B | B | B | ラテン大文字 B |
| 67 | C | C | C | C | ラテン大文字 C |
| 68 | D | D | D | D | ラテン大文字 D |
| 69 | E | E | E | E | ラテン大文字 E |
| 70 | F | F | F | F | ラテン大文字 F |
| 71 | G | G | G | G | ラテン大文字 G |
| 72 | H | H | H | H | ラテン大文字 H |
| 73 | I | I | I | I | ラテン大文字 I |
| 74 | J | J | J | J | ラテン大文字 J |
| 75 | K | K | K | K | ラテン大文字 K |
| 76 | L | L | L | L | ラテン大文字 L |
| 77 | M | M | M | M | ラテン大文字 M |
| 78 | N | N | N | N | ラテン大文字 N |
| 79 | O | O | O | O | ラテン大文字 O |
| 80 | P | P | P | P | ラテン大文字 P |
| 81 | Q | Q | Q | Q | ラテン大文字 Q |
| 82 | R | R | R | R | ラテン大文字 R |
| 83 | S | S | S | S | ラテン大文字 S |
| 84 | T | T | T | T | ラテン大文字 T |
| 85 | U | U | U | U | ラテン大文字 U |
| 86 | Ⅴ | Ⅴ | Ⅴ | Ⅴ | ラテン大文字 V |
| 87 | W | W | W | W | ラテン大文字 W |
| 88 | X | X | X | X | ラテン大文字 X |
| 89 | Y | Y | Y | Y | ラテン大文字 Y |
| 90 | Z | Z | Z | Z | ラテン大文字 Z |
| 91 | [ | [ | [ | [ | 左角括弧 |
| 92 | \ | \ | \ | \ | バックスラッシュ |
| 93 | ] | ] | ] | ] | 右角括弧 |
| 94 | ^ | ^ | ^ | ^ | サーカムフレックス |
| 95 | _ | _ | _ | _ | ローライン |
| 96 | | | グレイブアクセント | ||
| 97 | a | a | a | a | ラテン小文字 a |
| 98 | b | b | b | b | ラテン小文字 b |
| 99 | c | c | c | c | ラテン小文字 c |
| 100 | d | d | d | d | ラテン小文字 d |
| 101 | e | e | e | e | ラテン小文字 e |
| 102 | f | f | f | f | ラテン小文字 f |
| 103 | g | g | g | g | ラテン小文字 g |
| 104 | h | h | h | h | ラテン小文字 h |
| 105 | i | i | i | i | ラテン小文字 i |
| 106 | j | j | j | j | ラテン小文字 j |
| 107 | k | k | k | k | ラテン小文字 k |
| 108 | l | l | l | l | ラテン小文字 l |
| 109 | m | m | m | m | ラテン小文字 m |
| 110 | n | n | n | n | ラテン小文字 n |
| 111 | o | o | o | o | ラテン小文字o |
| 112 | p | p | p | p | ラテン小文字 p |
| 113 | q | q | q | q | ラテン小文字 q |
| 114 | r | r | r | r | ラテン小文字 r |
| 115 | s | s | s | s | ラテン小文字 s |
| 116 | t | t | t | t | ラテン小文字 t |
| 117 | u | u | u | u | ラテン小文字 u |
| 118 | v | v | v | v | ラテン小文字 v |
| 119 | w | w | w | w | ラテン小文字 w |
| 120 | x | x | x | x | ラテン小文字 x |
| 121 | y | y | y | y | ラテン小文字 y |
| 122 | z | z | z | z | ラテン小文字 z |
| 123 | { | { | { | { | 左中括弧 |
| 124 | | | | | | | | | 垂直線 |
| 125 | } | } | } | } | 右中括弧 |
| 126 | ~ | ~ | ~ | ~ | チルダ |
| 127 | DEL | ||||
| 128 | € | ユーロ記号 | |||
| 129 | | | | 使用されていない | |
| 130 | ‚ | シングルクォーテーション | |||
| 131 | ƒ | フック付きラテン小文字f | |||
| 132 | „ | ダブルクォーテーション | |||
| 133 | … | 水平方向の省略記号 | |||
| 134 | † | ダガー | |||
| 135 | ‡ | ダブルダガー | |||
| 136 | ˆ | 修飾サーカムフレックス | |||
| 137 | ‰ | パーミル記号 | |||
| 138 | Š | キャロン付きラテン大文字 S | |||
| 139 | ‹ | 単一の左向きの山形引用符 | |||
| 140 | Œ | ラテン大文字合字 OE | |||
| 141 | 使用されていない | ||||
| 142 | Ž | カロン付きのラテン大文字 Z | |||
| 143 | 使用されていない | ||||
| 144 | 使用されていない | ||||
| 145 | ‘ | 左シングルクォーテーション | |||
| 146 | ’ | 右シングルクォーテーション | |||
| 147 | “ | 左ダブルクォーテーション | |||
| 148 | ” | 右ダブルクォーテーション | |||
| 149 | • | バレット | |||
| 150 | – | ダッシュ | |||
| 151 | — | 全角ダッシュ | |||
| 152 | ˜ | 小さなチルダ | |||
| 153 | ™ | 商標記号 | |||
| 154 | š | キャロン付きのラテン小文字 s | |||
| 155 | › | 単一の右向きの山形引用符 | |||
| 156 | œ | ラテン小文字合字 oe | |||
| 157 | 使用されていない | ||||
| 158 | ž | カロン付きラテン小文字z | |||
| 159 | Ÿ | 分音符付きのラテン大文字 Y | |||
| 160 | 休憩スペースなし | ||||
| 161 | ¡ | ¡ | ¡ | 逆エクスクラメーションマーク | |
| 162 | ¢ | ¢ | ¢ | セント記号 | |
| 163 | £ | £ | £ | ポンド記号 | |
| 164 | ¤ | ¤ | ¤ | 通貨記号 | |
| 165 | ¥ | ¥ | ¥ | 円記号 | |
| 166 | ¦ | ¦ | ¦ | 壊れたバー | |
| 167 | § | § | § | セクション記号 | |
| 168 | ¨ | ¨ | ¨ | 分音記号 | |
| 169 | © | © | © | 著作権記号 | |
| 170 | ª | ª | ª | 女性序数指標 | |
| 171 | « | « | « | 左向き二重角引用符 | |
| 172 | ¬ | ¬ | ¬ | 署名しない | |
| 173 | | | | ソフトハイフン | |
| 174 | ® | ® | ® | 登録記号 | |
| 175 | ¯ | ¯ | ¯ | マクロン | |
| 176 | ° | ° | ° | 度記号 | |
| 177 | ± | ± | ± | プラスマイナス記号 | |
| 178 | ² | ² | ² | 上付き二文字 | |
| 179 | ³ | ³ | ³ | 上付きの 3 | |
| 180 | ´ | ´ | ´ | 揚音符 | |
| 181 | µ | µ | µ | マイクロサイン | |
| 182 | ¶ | ¶ | ¶ | ピルクロウサイン | |
| 183 | · | · | · | 中点 | |
| 184 | ¸ | ¸ | ¸ | セディラ | |
| 185 | ¹ | ¹ | ¹ | 上付き文字 | |
| 186 | º | º | º | 男性序数指標 | |
| 187 | » | » | » | 右向き二重角引用符 | |
| 188 | ¼ | ¼ | ¼ | 下品な分数の4分の1 | |
| 189 | ½ | ½ | ½ | 下品な分数の半分 | |
| 190 | ¾ | ¾ | ¾ | 下品な分数の4分の3 | |
| 191 | ¿ | ¿ | ¿ | 逆疑問符 | |
| 192 | À | À | À | グレイブ付きラテン大文字 A | |
| 193 | Á | Á | Á | 揚音符付きラテン大文字 A | |
| 194 | Â | Â | Â | サーカムフレックス付きラテン大文字A | |
| 195 | Ã | Ã | Ã | チルダ付きラテン大文字 A | |
| 196 | Ä | Ä | Ä | 分音記号付きラテン大文字 A | |
| 197 | Å | Å | Å | 上にリングが付いたラテン大文字 A | |
| 198 | Æ | Æ | Æ | ラテン大文字AE | |
| 199 | Ç | Ç | Ç | セディーユ付きラテン大文字 C | |
| 200 | È | È | È | グレイブ付きラテン大文字 E | |
| 201 | É | É | É | 揚音符付きラテン大文字 E | |
| 202 | Ê | Ê | Ê | サーカムフレックス付きラテン大文字 E | |
| 203 | Ë | Ë | Ë | 分音符付きラテン大文字 E | |
| 204 | Ì | Ì | Ì | グレイブ付きラテン大文字 I | |
| 205 | Í | Í | Í | 揚音符付きラテン大文字 I | |
| 206 | Î | Î | Î | サーカムフレックス付きラテン大文字 I | |
| 207 | Ï | Ï | Ï | ラテン大文字 I に分音符を付ける | |
| 208 | Ð | Ð | Ð | ラテン大文字Eth | |
| 209 | Ñ | Ñ | Ñ | チルダ付きラテン大文字 N | |
| 210 | Ò | Ò | Ò | グレイブ付きラテン大文字 O | |
| 211 | Ó | Ó | Ó | 揚音符付きラテン大文字 O | |
| 212 | Ô | Ô | Ô | サーカムフレックス付きラテン大文字 O | |
| 213 | Õ | Õ | Õ | チルダ付きラテン大文字 O | |
| 214 | Ö | Ö | Ö | 分音記号付きのラテン大文字 O | |
| 215 | × | × | × | 乗算記号 | |
| 216 | Ø | Ø | Ø | ストローク付きラテン大文字 O | |
| 217 | Ù | Ù | Ù | グレイブ付きラテン大文字 U | |
| 218 | Ú | Ú | Ú | 揚音符付きラテン大文字 U | |
| 219 | Û | Û | Û | サーカムフレックス付きラテン大文字 U | |
| 220 | Ü | Ü | Ü | 分音符付きのラテン大文字 U | |
| 221 | Ý | Ý | Ý | 揚音符付きラテン大文字 Y | |
| 222 | Þ | Þ | Þ | ラテン大文字のとげ | |
| 223 | ß | ß | ß | ラテン小文字シャープ s | |
| 224 | à | à | à | グレイブ付きラテン小文字a | |
| 225 | á | á | á | 揚音符付きラテン小文字 a | |
| 226 | â | â | â | サーカムフレックス付きラテン小文字a | |
| 227 | ã | ã | ã | チルダ付きラテン小文字a | |
| 228 | ä | ä | ä | ラテン小文字aと分音符号 | |
| 229 | å | å | å | 上にリングが付いたラテン小文字a | |
| 230 | æ | æ | æ | ラテン小文字ae | |
| 231 | ç | ç | ç | セディーユ付きラテン小文字c | |
| 232 | è | è | è | グレイブ付きラテン小文字 e | |
| 233 | é | é | é | 揚音符付きラテン小文字 e | |
| 234 | ê | ê | ê | サーカムフレックス付きのラテン小文字 e | |
| 235 | ë | ë | ë | 分音符号付きのラテン小文字 e | |
| 236 | ì | ì | ì | グレイブ付きラテン小文字i | |
| 237 | í | í | í | 揚音符付きラテン小文字 i | |
| 238 | î | î | î | サーカムフレックス付きラテン小文字i | |
| 239 | ï | ï | ï | 分音符付きのラテン小文字i | |
| 240 | ð | ð | ð | ラテン小文字eth | |
| 241 | ñ | ñ | ñ | チルダ付きラテン小文字n | |
| 242 | ò | ò | ò | グレイブ付きラテン小文字 o | |
| 243 | ó | ó | ó | 揚音符付きラテン小文字 o | |
| 245 | õ | õ | õ | チルダ付きラテン小文字 o | |
| 246 | ö | ö | ö | 分音符号付きのラテン小文字 o | |
| 247 | ÷ | ÷ | ÷ | 分割記号 | |
| 248 | ø | ø | ø | ストローク付きラテン小文字 o | |
| 249 | ù | ù | ù | グレイブ付きラテン小文字u | |
| 250 | ú | ú | ú | 揚音符付きラテン小文字 u | |
| 251 | û | û | û | サーカムフレックス付きラテン小文字u | |
| 252 | ü | ü | ü | 分音符付きのラテン小文字 u | |
| 253 | ý | ý | ý | 揚音符付きラテン語の小文字 y | |
| 254 | þ | þ | þ | ラテン小文字のとげ | |
| 255 | ÿ | ÿ | ÿ | 分音記号付きラテン小文字y |
ASCII文字セット
ASCIIは、制御文字に0~31(および127)の値を使用します。
ASCIIは、文字、数字、および記号に32から126までの値を使用します。
ASCIIは128から255までの値を使用しません。
ANSI文字セット(Windows-1252)
ANSIは、0~127の値についてはASCIIと同じです。
ANSIには、128~159の値に対応する独自の文字セットがあります。
ANSIは、160から255までの値についてはUTF-8と同じです。
ISO-8859-1文字セット
ISO-8859-1は、0~127の値についてはASCIIと同じです。
ISO-8859-1は128から159までの値を使用しません。
ISO-8859-1は、160から255までの値についてUTF-8と同じです。
UTF-8文字セット
UTF-8は、0から127までの値についてはASCIIと同じです。
UTF-8は128から159までの値を使用しません。
UTF-8は、160から255までの値について、ANSIと8859-1の両方と同じです。
UTF-8は、値256から10,000を超える異なる文字で継続します。
詳細については、完全なHTML文字セットリファレンスをご覧ください。