HTML Encoding (Character Sets)

HTML Encoding या Character Set यह बताता है कि browser text को किस encoding में पढ़े और display करे।
Character set के बिना browser यह नहीं समझ पाता कि characters, symbols और emojis को कैसे render करना है।

Character Set क्यों ज़रूरी होता है?

Different languages में अलग-अलग characters होते हैं।
Special symbols और emojis सही तरीके से दिखाने के लिए encoding ज़रूरी है।
Wrong encoding से text टूटे हुए symbols में बदल सकता है।

HTML में Character Set कैसे define किया जाता है?

HTML document के <head> section में character set define किया जाता है।

<meta charset="UTF-8">

यह HTML5 का recommended और most widely used encoding है।

UTF-8 Character Set

UTF-8 एक universal character encoding है जो लगभग सभी languages और symbols को support करती है।

UTF-8 की खास बातें
English, Hindi, Arabic, Chinese जैसी सभी languages support करता है
Symbols और emojis को सही दिखाता है
Modern web का standard माना जाता है

Example:

<p>नमस्ते 🌍</p>

ASCII Character Set

ASCII पुराने समय का character set है।

ASCII में केवल
English letters (A–Z, a–z)
Digits (0–9)
Basic symbols

support होते हैं।

ASCII emojis और non-English languages को support नहीं करता।

ISO-8859-1 Character Set

ISO-8859-1 को Latin-1 भी कहा जाता है।

यह Western European languages को support करता है।
लेकिन Hindi, Arabic, Chinese और emojis support नहीं करता।

Example:

<meta charset="ISO-8859-1">

UTF-8 बनाम ISO-8859-1

UTF-8 सभी languages और symbols support करता है।
ISO-8859-1 limited languages तक ही सीमित है।
Modern websites के लिए UTF-8 best choice है।

HTML Encoding और HTML Entities

Character encoding सही होने पर direct symbols लिखे जा सकते हैं।
Encoding सही न होने पर entities का इस्तेमाल safe माना जाता है।

Example:

<p>&copy; 2025</p>
<p>© 2025</p>

UTF-8 में दोनों सही काम करते हैं।

Emojis और Encoding

Emojis केवल UTF-8 encoding में सही दिखते हैं।

<meta charset="UTF-8">
<p>Success 🚀</p>

Encoding गलत होने पर emoji box या question mark दिख सकता है।

Multiple Languages के लिए Encoding

Multi-language website के लिए UTF-8 अनिवार्य है।

Example:

<p>Hello</p>
<p>नमस्ते</p>
<p>مرحبا</p>
<p>你好</p>

Encoding Best Practices

हमेशा UTF-8 encoding use करें
<meta charset="UTF-8"> को <head> में सबसे ऊपर रखें
Old encodings से बचें
Database और server encoding भी UTF-8 रखें

HTML Encoding (Character Sets) Summary

Character set browser को text पढ़ने का तरीका बताता है
UTF-8 सबसे recommended encoding है
Emojis और multi-language support के लिए UTF-8 ज़रूरी है
Wrong encoding से text corrupt हो सकता है

Share your love