Unicode தமிழ் எப்படி வேலை செய்கிறது?
Unicode தமிழ் — சுருக்கமாக
Unicode என்பது உலகின் அனைத்து மொழிகளுக்கும் பொதுவான ஒரே குறியீட்டு முறையை வழங்கும் ஒரு சர்வதேச தரமாகும். இதில் தமிழுக்கும் ஒரு தனித்துவமான குறியீட்டு பகுதி (Unicode Block) ஒதுக்கப்பட்டுள்ளது.
Unicode மூலம் தமிழ் எழுத்துகள் எந்தக் கணினி, மொபைல், இணையதளம் அல்லது software-லும் ஒரே மாதிரியான வடிவிலும், மதிப்பிலும் காண்பிக்கப்படும்.
? Unicode தமிழ் எப்படி வேலை செய்கிறது? (சுருக்கமாக)
1️⃣ ஒவ்வொரு எழுத்துக்கும் ஒரு எண்குறி (Code Point)
உதாரணம்:
-
அ → U+0B85
-
க → U+0B95
இந்த code point-ஐப் பயன்படுத்தியே computer அந்த எழுத்தை புரிந்துகொள்கிறது.
2️⃣ தமிழில் எழுத்துகள் ‘கூட்டு எழுத்து’ முறையில் உருவாகும்
தமிழ் எழுத்துகள் pallavi + அச்சு (vowel sign) ஒன்றிணைவதன் மூலம் உருவாகின்றன.
உதா:
-
க + ா = கா
-
த + ீ = தீ
Unicode இந்த two-part combination-ஐ rendering engine மூலம் படம்போல் சரியாக காட்டுகிறது.
3️⃣ Rendering Engine (Font + Shaping) வேலை
Computer-ல் தமிழ் எழுத்தை காட்டுவதற்கு:
-
Unicode code point →
-
Font glyph (எழுத்துரு வடிவம்) →
-
Shaping rules மூலம் சரியான இடத்தில் அச்சு அமையும்
எ.கா. “க் + க” → “க்க”
4️⃣ Tamil Unicode Block
தமிழுக்கான இடம்: 0B80 – 0BFF
இதனுள் வருகின்றன:
-
உயிரெழுத்துகள்
-
மெய்யெழுத்துகள்
-
உயிர்மெய்கள் (கூட்டலால் உருவாகும்)
-
குறியீடுகள், புள்ளி, ஒலி குறிகள்
? Unicode தமிழ் ஏன் முக்கியம்?
-
அனைத்து device-களிலும் ஒரே மாதிரி தமிழ் எழுத & படிக்க
-
ASCII போன்ற பழைய encoding-களின் குழப்பம் (TSCII, TAB, TAM, Bamini) தவிர்க்க
-
Internet, Database, Mobile apps அனைத்திலும் standard support கிடைக்க
-
Copy-paste செய்தாலும் எழுத்து கெடாமல் இருக்கும்
⭐ சுருக்கமாக
-
Unicode தமிழ் ஒவ்வொரு எழுத்துக்கும் unique code point கொடுக்கிறது.
-
தமிழ் எழுத்துகள் combination-based (மெய் + அச்சு).
-
Rendering engine மற்றும் font மூலம் computer சரியான எழுத்தை வரையுகிறது.
-
Unicode தமிழ் உலகளவில் ஒரே மாதிரி செயல்பட உதவுகிறது.
தொடர்புடைய பதிவுகள்