संगणकमाहिती तंत्रज्ञान

एन्कोडिंग "युनिकोड": वर्ण कोडींग मानक

एक सेट प्रयत्न प्रत्येक इंटरनेट वापरकर्ता वर किंवा किमान एकदा त्याच्या कार्य इतर लिहिले स्क्रीनवर पाहिले लॅटिन अक्षरे शब्द "युनिकोड." हे काय आहे, आपण या लेख वाचून शिकाल.

व्याख्या

एन्कोडिंग "युनिकोड" - वर्ण एन्कोडिंग मानक. यामध्ये युनिकोड Inc. विना-नफा संस्था द्वारे प्रस्तावित होते 1991 मध्ये. मानक दस्तऐवज वर्ण विविध प्रकारच्या मोठ्या शक्य संख्या एकत्र आणण्यासाठी आली आहे. पृष्ठ, त्याचा आधारावर स्थापन करण्यात आले, (कोरियन रशियन पासून) विविध भाषा आणि गणिती चिन्हे अक्षरे आणि वर्ण असू शकतात. या प्रकरणात, वर्ण संच वर्ण सर्व कोणत्याही समस्या न प्रदर्शित केली जातात.

निर्मिती कारणे

एकदा एक वेळ यावर, लांब एकाच प्रणालीवर देखावा आधी "युनिकोड" एन्कोडिंग दस्तऐवज लेखक प्राधान्ये आधारित निवडले आहे. या कारणास्तव, अनेकदा एक दस्तऐवज वाचा, तो विविध सारण्या वापर करणे आवश्यक होते. कधी कधी तो मोठ्या मानाने सरासरी वापरकर्ता जीवन complicates जे अनेक वेळा, काय करणे आवश्यक आहे. आधीच नमूद केल्याप्रमाणे, वर्ण एन्कोडिंग एक नवीन प्रकार ऑफर 1991 मध्ये ह्या समस्येचा तोडगा युनिकोड Inc. करण्यासाठी विना-नफा संस्था आमंत्रित केले होते. हे कालबाह्य व मानदंड विविध एकत्र तयार केले होते. "युनिकोड" - वेळी अशक्य साध्य ozvolila की एन्कोडिंग: वर्णांची एक प्रचंड संख्या समर्थन एक साधन तयार करण्यासाठी. परिणाम अनेक अपेक्षा ओलांडली - एकाच वेळी इंग्रजी व रशियन मजकूर, लॅटिन, आणि गणितातील सूत्रांचे असलेली दस्तऐवज होते.

पण गरज अगोदर एक समग्र कोडींग निर्माण झाल्यामुळे आधीच त्या वेळी विद्यमान मानके प्रचंड विविध झाला आहे की समस्या संख्या निराकरण करण्यासाठी. त्यापैकी सर्वात सामान्य:

  • Elvish लेखन, किंवा "हो";
  • वर्ण संच मर्यादा;
  • समस्या codings परिवर्तन;
  • फॉन्ट दुप्पट.

लहान ऐतिहासिक विषयातुन प्रसंगोपात होणारे विषयांतर

आवारातील 80 व्या अशी कल्पना करा. संगणकाचे हार्डवेअर त्यामुळे सामान्य नाही आणि आज वेगळे एक प्रकार आहे. प्रत्येक OS अद्वितीय आहे आणि प्रत्येक उत्साही विशिष्ट गरजा शुद्ध आहे. माहितीची देवाण-घेवाण आवश्यक अतिरिक्त rework सर्वकाही मध्ये रूपांतर. इतर कार्य प्रणाली निर्माण दस्तऐवज वाचू प्रयत्न करत आहे, अनेकदा वर्ण एक विचित्र संच दाखवतो, आणि खेळ एन्कोडिंग सुरू होते. तो नेहमी लवकर हे करू शकत नाही, आणि कधी कधी आवश्यक दस्तऐवज अक्षम नंतर सहा महिन्यांत उघडा, आणि. वारंवार माहिती देवाणघेवाण कोण स्वत: साठी एक रूपांतरण टेबल तयार, लोक. मागे आणि पुढे "आपल्या माझा पासून" दोन त्रेधा तयार करण्याची आवश्यकता: त्यांना एक मनोरंजक तपशील मिळतो आणि कार्य. स्रोत उजव्या स्तम्भ मध्ये ते, करा सर्वसाधारण उलटा संगणकाप्रमाणे करू शकत नाही, आणि डाव्या - परिणाम, पण नाही उलट. आपण दस्तऐवजामध्ये कोणत्याही विशेष वर्ण वापरण्याची गरज दिसत असेल तर, ते प्रथम जोडले जाऊ लागले, आणि नंतर दुसर्या आणि भागीदार तो काय हे वर्ण करू एक होऊ नका आवश्यक आहे हे स्पष्ट करण्यासाठी "हो." आणि की प्रत्येक एन्कोडिंग विकसित किंवा OS मध्ये डुप्लीकेट एक प्रचंड संख्या निर्माण झाली जे त्यांच्या स्वत: च्या फॉन्ट अंमलबजावणी होते विसरू नये.

पुढील कल्पना करा पृष्ठावर फॉन्ट, आपण एक लहान टीप एकसारखे टाइम्स न्यू रोमन 10 तुकडे दिसेल की: UTF-8 आहे, UTF-16, ANSI, UCS-2. आता तुम्ही वैश्विक मानके विकास अत्यावश्यक होती का?

"निर्माते संस्थापक पूर्वजांनी"

युनिकोड निर्माण उगम झेरॉक्स पासून Dzho Bekker ली कॉलिन्स आणि ऍपल पासून मार्क डेव्हिस सोबत, एक सार्वत्रिक वर्ण संच व्यावहारिक निर्मिती क्षेत्रात संशोधन सुरू झाला तेव्हा 1987 मध्ये आढळू. ऑगस्ट 1988 मध्ये, Dzho Bekker 16-बिट बहुभाषिक आंतरराष्ट्रीय कोडींग प्रणाली निर्माण करण्यासाठी मसुदा प्रस्ताव प्रकाशित.

काही महिने नंतर युनिकोड कार्यरत गट एक सामान्य कोडींग मानक प्राथमिक निर्मिती वर काम पूर्ण करणे RLG पासून केन विसलर आणि माईक Kernegana, Sun Microsystems आणि अनेक इतर तज्ञांनी ग्लेन Rayt समावेश विस्तार करण्यात आला.

सामान्य वर्णन

युनिकोड प्रतीक संकल्पना आधारित. या व्याख्या Grapheme (त्यांच्या "पोट्रेट") माध्यमातून लेखन एका विशिष्ट स्वरूपात अस्तित्वात आहे आणि लक्षात आलं की, एक गोषवारा इंद्रियगोचर संदर्भित अंतर्गत. प्रत्येक अक्षर "युनिकोड" एक विशिष्ट युनिट मानक राहण्याचे अद्वितीय कोड दिली आहे. उदा Grapheme ब इंग्रजी आणि रशियन अक्षरे मध्ये देखील आहे, पण ते युनिकोड 2 भिन्न वर्ण संबंधित आहे. ते रूपांतरण अधीन आहेत लोअरकेस, टी. ई की डेटाबेस वर्णन करते प्रत्येक, गुणधर्म संच व संपूर्ण नाव.

युनिकोड फायदे

"UNICODE" एन्कोड इतर समकालीन पासून "एनक्रिप्शन" वर्ण चिन्हे एक प्रचंड स्टॉक आहे. त्याच्या predecessors होते की 8 बिट खरं, की 28 वर्ण द्वारे समर्थीत आहे, पण नवीन डिझाइन आधीच 216 वर्ण होते की पुढे एक मोठे पाऊल होते. या परवानगी साध्या भाषेतील जवळजवळ सर्व विद्यमान आणि सामान्य अक्षरे.

"युनिकोड" घटने किंवा प्रसंगाचे आगमन सह यापुढे एक रूपांतरण टेबल वापर करणे आवश्यक आहे: तो फक्त त्यांना गरज negated एकच मानक म्हणून. तसेच, ते विस्मरण मध्ये बुडणे आहेत, आणि "हो" - एका मानक बाहेर डुप्लिकेट फॉन्ट तयार करण्याची आवश्यकता त्यांना अशक्य, तसेच नियम केले.

युनिकोड विकास

अर्थात, प्रगती ठिकाणी नाही आहे, आणि प्रथम सादरीकरण पासून 25 वर्षे झाली आहे. तथापि, अक्षरसंच "युनिकोड" छातीचा कोट जगात त्याचे स्थान ठेवते. अनेक प्रकारे हे की त्याची अंमलबजावणी करण्यासाठी सोपे झाले आहे आणि पसरला आहे, की ते शक्य धन्यवाद करण्यात आली आहे, मालकी (सशुल्क) व ओपन सोअर्स सॉफ्टवेअर विकसक ओळखले जात.

आम्ही आज आम्ही एक शतक पूर्वी उपांत्यपूर्व समान कोड "युनिकोड" पाहू विश्वास करू नये. क्षणी, आवृत्ती 5.h.h बदलले होते आणि कोड प्रतीक संख्या 231. वाढला आहे एक मोठे मार्जिन गुण नकार दिला वापरून अजूनही युनिकोड-16 समर्थन राखण्यासाठी शक्यता रोजी (एन्कोडिंग, जेथे त्यांच्या मर्यादित संख्या 216 जास्तीत जास्त रक्कम). सुरुवातीपासूनच आणि आवृत्ती 2.0.0 "युनिकोड मानक" तो जवळजवळ 2 वेळा समाविष्ट वर्णांची संख्या वाढली आहे. संधी आणि येत्या काही वर्षांत चालू वाढ. आवृत्ती 4.0.0 आधीपासूनच मानक स्वतः वाढ करण्याची गरज आहे, आणि त्या केले होते. एक परिणाम म्हणून, "युनिकोड" आज आपण जे माहीत आहे त्याविषयी फॉर्म आढळले आहे.

युनिकोड मध्ये काय आहे?

अफाट व्यतिरिक्त, सतत वर्ण संख्या अद्यतनित, "युनिकोड" -Encoding मजकूर माहिती उपयुक्त विशेष गुण आहे. हे तर म्हणतात सामान्यीकरण आहे. उलट वर्ण संपूर्ण दस्तऐवज वर्ण स्क्रोल करणे, आणि पत्रव्यवहार टेबल चिन्ह पर्याय पेक्षा, विद्यमान सामान्यीकरण अल्गोरिदम एक वापरा. हे काय आहे?

त्याऐवजी, जे विविध अक्षरे समान असू शकते समान वर्ण, एक नियमित तपासणी संगणक संसाधनांची वाया एक विशेष अल्गोरिदम वापरून. आपण एक समान चिन्ह वेगळ्या स्तंभ पाहण्याच्या टेबल करा आणि नाही आणि पुन्हा पुन्हा सर्व डेटा तपासून त्यांना आधीच लागू करण्यास अनुमती देते.

अशा अल्गोरिदम विकसित आणि चार अंमलबजावणी आहेत. प्रत्येक रूपांतरण म्हणून कॉल त्यांना कोणतेही एक सर्वात कार्यक्षम करणे शक्य नाही, काटेकोरपणे निश्चित तत्त्व, इतर वेगळे स्थान घेते. विशिष्ट गरजा डिझाइन प्रत्येक, एम्बेडेड आणि यशस्वीरित्या वापरले होते.

प्रसार मानक

त्याच्या इतिहास एन्कोडिंग "UNICODE" 25 वर्षे मी कदाचित जगातील सर्वात व्यापक प्राप्त झाली आहे. हे मानक अंतर्गत कार्यक्रम आणि वेब-पृष्ठे समायोजित केले गेले आहेत. अर्ज रुंदी युनिकोड आता इंटरनेट स्त्रोत 60% पेक्षा जास्त वापरली सूचित करू शकते.

"युनिकोड" मानक दिसू लागले तेव्हा आता, तुम्हाला माहीत आहे. तो आहे काय, आपण देखील माहीत आहे आणि शोध पूर्ण महत्त्व, तज्ञ युनिकोड Inc. एक गट करून केले प्रशंसा करण्यास सक्षम असेल 25 पेक्षा अधिक वर्षांपूर्वी.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 mr.birmiss.com. Theme powered by WordPress.