HTML Encoding या Character Set यह बताता है कि browser text को किस encoding में पढ़े और display करे।
Character set के बिना browser यह नहीं समझ पाता कि characters, symbols और emojis को कैसे render करना है।
Character Set क्यों ज़रूरी होता है?
Different languages में अलग-अलग characters होते हैं।
Special symbols और emojis सही तरीके से दिखाने के लिए encoding ज़रूरी है।
Wrong encoding से text टूटे हुए symbols में बदल सकता है।
HTML में Character Set कैसे define किया जाता है?
HTML document के <head> section में character set define किया जाता है।
<meta charset="UTF-8">
यह HTML5 का recommended और most widely used encoding है।
UTF-8 Character Set
UTF-8 एक universal character encoding है जो लगभग सभी languages और symbols को support करती है।
UTF-8 की खास बातें
English, Hindi, Arabic, Chinese जैसी सभी languages support करता है
Symbols और emojis को सही दिखाता है
Modern web का standard माना जाता है
Example:
<p>नमस्ते 🌍</p>
ASCII Character Set
ASCII पुराने समय का character set है।
ASCII में केवल
English letters (A–Z, a–z)
Digits (0–9)
Basic symbols
support होते हैं।
ASCII emojis और non-English languages को support नहीं करता।
ISO-8859-1 Character Set
ISO-8859-1 को Latin-1 भी कहा जाता है।
यह Western European languages को support करता है।
लेकिन Hindi, Arabic, Chinese और emojis support नहीं करता।
Example:
<meta charset="ISO-8859-1">
UTF-8 बनाम ISO-8859-1
UTF-8 सभी languages और symbols support करता है।
ISO-8859-1 limited languages तक ही सीमित है।
Modern websites के लिए UTF-8 best choice है।
HTML Encoding और HTML Entities
Character encoding सही होने पर direct symbols लिखे जा सकते हैं।
Encoding सही न होने पर entities का इस्तेमाल safe माना जाता है।
Example:
<p>© 2025</p>
<p>© 2025</p>
UTF-8 में दोनों सही काम करते हैं।
Emojis और Encoding
Emojis केवल UTF-8 encoding में सही दिखते हैं।
<meta charset="UTF-8">
<p>Success 🚀</p>
Encoding गलत होने पर emoji box या question mark दिख सकता है।
Multiple Languages के लिए Encoding
Multi-language website के लिए UTF-8 अनिवार्य है।
Example:
<p>Hello</p>
<p>नमस्ते</p>
<p>مرحبا</p>
<p>你好</p>
Encoding Best Practices
हमेशा UTF-8 encoding use करें<meta charset="UTF-8"> को <head> में सबसे ऊपर रखें
Old encodings से बचें
Database और server encoding भी UTF-8 रखें
HTML Encoding (Character Sets) Summary
Character set browser को text पढ़ने का तरीका बताता है
UTF-8 सबसे recommended encoding है
Emojis और multi-language support के लिए UTF-8 ज़रूरी है
Wrong encoding से text corrupt हो सकता है
