EUCのエンコード方式上にASCIIとJIS X 0208文字集合を配置したもので、半角カナ(JIS X 0201)とJIS補助漢字(JIS X 0212)も含むことができる。半角カナと補助漢字を使用しない場合は、JIS X 0208で規定されている符号化方式「国際基準版・漢字用8ビット符号」と同一となる。ISO/IEC 2022に適合する。
日本語文字はJIS X 0208をGR領域に表現したものを基本としており、2バイトで表現され、1バイト目、2バイト目ともに0x80~0xFFの範囲内にある。このため英数字と日本語文字の区別がしやすく、プログラム上での扱いが楽である。ただし、補助漢字は制御文字SS3 (シングルシフトスリー、0x8F) に続けて現れるので、都合3バイトを要する。