بلوک یونیکد
این مقاله، بلوک یونیکد، اخیراً بهواسطهٔ فرایند ایجاد مقاله ایجاد شدهاست. بازبینیکننده در حال بستن درخواست است و این برچسب احتمالاً بهزودی برداشته میشود.
ابزارهای بازبینی: پیشبارگیری بحث اعلان به نگارنده |
خطای اسکریپتی: پودمان «AfC submission catcheck» وجود ندارد.
بلوک یونیکد یکی از چندین محدوده کدهای کاراکتر عددی (موقعیت کد) پشت سر هم، از مجموعه کاراکترهای یونیکد است که توسط کنسرسیوم یونیکد و با هدف اهداف اداری و مستندسازی تعریف شده است. به طور معمول، پیشنهادهای تغییر (مانند افزودن گلیف های جدید) را با توجه بلوک یا بلوک های مربوطه مورد بحث و بررسی قرار می دهند.
به طور کلی و نه همیشه، هر بلوک برای ارائه حروف های مورد استفاده در یک یا چند زبان خاص، یا در برخی زمینه های کاربردی عمومی مانند ریاضیات ، نقشه برداری ، حروفچینی تزئینی، انجمن های اجتماعی و غیره به کار می رود.
طراحی و پیاده سازی[ویرایش]
بلوکهای یونیکد با نامهای منحصربهفرد شناسایی میشوند و فقط با استفاده از کاراکترهای اسکی بیان میشود. این بلوک ها معمولاً ماهیت نمادها را به زبان انگلیسی توصیف میکنند. مانند "Tibetan" یا "Supplemental Arrows-A". (هنگام مقایسه نام بلوکها، باید حروف بزرگ و کوچک انگلیسی را یکسان در نظر بگیریم، و از انواع فاصله سفید، خط تیره و خط های زیرین چشم پوشی کنیم؛ بنابراین نام بلوک «supplemental_arrows__a» معادل «SUPPLEMENTALARROWSA» است. [۱]
بلوک ها دو به دو جدا هستند؛ یعنی همپوشانی ندارند. نقطه شروع موقعیت کد و اندازه (تعداد موقعیت کدهای) هر بلوک همیشه مضربی از 16 است. بنابراین، در نماد شانزدهشانزدهی ، نقطه شروع (کوچکترین) U+ xxx0 و نقطه پایانی (بزرگترین) U+yyyF است، که در آن xxx و yyy سه یا چند رقم شانزدهشانزدهی هستند. (این محدودیت ها به منظور ساده سازی نمایش حروف در اسناد کنسرسیوم یونیکد در نظر گرفته شده است، به این منظور، اسناد به شکل جداول با 16 ستون که آخرین ستون آن با آخرین رقم شانزدهشانزدهی نقطه کد برچسب گذاری شده اند، تهیه می شوند. [۱] ) اندازه یک بلوک می تواند از حداقل 16 تا حداکثر 65536 نقطه کد متغیر باشد.
هر موقعیت کد یک ویژگی گلیف به نام "بلوک" را همراه خود دارد. مقدار این ویژگی یک رشته کاراکتری است و به بلوک منحصر به فردی که صاحب آن نقطه است اشاره می کند. [۲] با این حال، یک بلوک ممکن است حاوی یک یا چند موقعیت کد باشد که تاکنون به چیزی اختصاص نیافته باشند. اینگونه موقعیت کدها معمولاً برای اضافه کردن کاراکترهایی که «منطقاً» باید به آن بلوک تعلق داشته باشند، کنار گذاشته میشوند. موقعیت کدهایی که به هیچ یک از بلوکهای نامگذاری شده تعلق نداشته باشد دارای مقدار block="No_block" هستند، مثالاً موقعیت کدهای صفحات تخصیصنیافته 4 تا 13. [۱]
سایر طبقه بندی ها[ویرایش]
هر نقطه یونیکد دارای یک ویژگی دیگر به نام "دستهبندی عمومی" است که تلاش می کند نقش نماد مربوطه را در زبان ها یا برنامه هایی که به خاطر آنها در سیستم گنجانده شده است، توصیف کند. نمونههایی از دستهبندیهای عمومی عبارتند از "Lu" (به معنای حرف بزرگ)، "Nd" (رقم اعشاری)، "Pi" (نقطهگذاری با نقل قول باز) و "Mn" (علامت بدون فاصله، یعنی نشانهای که قبل گلیف می آید). این تقسیمبندی کاملاً مستقل از بلوکهای کد است: نقاط کد با یک دسته کلی معین عموماً بلوکهای زیادی را در بر میگیرند و لازم نیست حتی در هر بلوک متوالی باشند. [۳]
هر موقعیت کد دارای یک ویژگی نوشتاری که مشخص می کند برای کدام سیستم نوشتاری در نظر گرفته شده است یا اینکه آیا برای چندین سیستم نوشتاری در نظر گرفته شده است. این ویژگی نیز مستقل از بلوک است.
در توصیف سیستم یونیکد، یک بلوک ممکن است به زیرگروههای خاصتری تقسیم شود، مانند « نمادهای شطرنج » در بلوک نمادهای متفرقه (با بلوک نمادهای شطرنج مستقل اشتباه گرفته نشود). این زیرگروه ها به معنای فنی که توسط کنسرسیوم یونیکد استفاده می شود "بلوک" به حساب نمی آیند و فقط برای راحتی کاربران نامگذاری شده اند.
لیست بلوک ها[ویرایش]
یونیکد 14.0 تعداد 320 بلوک را تعریف می کند: [۱]
- 164 بلوک در صفحه 0، صفحه چند زبانه پایه (در جدول زیر: بلوک یونیکد § Notes )
- 145 بلوک در صفحه 1، صفحه چند زبانه تکمیلی ( بلوک یونیکد § Notes )
- 6 بلوک در صفحه 2، صفحه ایدئوگرافیک تکمیلی ( بلوک یونیکد § Notes )
- 1 بلوک در صفحه 3، صفحه ایدئوگرافیک سوم ( بلوک یونیکد § Notes )
- 2 بلوک در صفحه 14 (E در شانزدهشانزدهی )، صفحه ویژه تکمیلی ( بلوک یونیکد § Notes )
- یک بلوک در هر کدام از صفحات 15 (Fhex) و 16 (10hex) که به نام منطقه استفاده شخصی تکمیلی A و B خوانده می شوند (بلوک یونیکد § Notes)
بلوک های حذف شده[ویرایش]
خط مشی پایداری یونیکد ایجاب می کند که یک کاراکتر، پس از اختصاص دادن، نباید جابجا یا حذف شود، ولی می تواند است منسوخ شود. این ویژگی در نسخه Unicode 2.0 به بعد اعمال می شود.
قبل از این، بلوک های قبلی زیر حذف شدند:
محدوده بلوک | تاریخی </br> نام بلوک |
نسخه هنگام اضافه شدن | نسخه هنگام حذف | محدوده اکنون توسط | جایگزین بلوک شد | نقاط کد | شخصیت های اختصاص داده شده | اسکریپت ها |
---|---|---|---|---|---|---|---|---|
U+1000..U+105F | تبتی [۴] | 1.0.0 | 1.0.1 | میانمار | تبتی | 96 | 71 | تبتی |
U+3400..U+3D2D | هانگول [۵] | 1.0.0 | 2.0 | CJK Unified Ideographs Extension A | هجاهای هانگول | 2350 | 2350 | هانگول |
U+3D2E..U+44B7 | هانگول مکمل-A [۵] | 1.1 | 2.0 | 1930 | 1930 | هانگول | ||
U+44B8..U+4DFF | هانگول مکمل-B [۵] | CJK Ideographs Unified Extension A و Yijing Hexagram Symbos | 2376 | 2376 | هانگول |
منابع[ویرایش]
- ↑ ۱٫۰ ۱٫۱ ۱٫۲ ۱٫۳ "Unicode Blocks data file, Unicode version 14.0". Unicode Consortium. Retrieved 2021-09-15.صفحه پودمان:Citation/CS1/en/styles.css محتوایی ندارد. خطای یادکرد: برچسب
<ref>
نامعتبر؛ نام «uniblocks» چندین بار با محتوای متفاوت تعریف شده است خطای یادکرد: برچسب<ref>
نامعتبر؛ نام «uniblocks» چندین بار با محتوای متفاوت تعریف شده است خطای یادکرد: برچسب<ref>
نامعتبر؛ نام «uniblocks» چندین بار با محتوای متفاوت تعریف شده است - ↑ Unicode glossary
- ↑ "Unicode Core Specification, Chapter 4: Character Properties" (PDF). Retrieved 2021-09-15.صفحه پودمان:Citation/CS1/en/styles.css محتوایی ندارد.
- ↑ "3.8: Block-by-Block Charts" (PDF). The Unicode Standard. Unicode Consortium.صفحه پودمان:Citation/CS1/en/styles.css محتوایی ندارد.
- ↑ ۵٫۰ ۵٫۱ ۵٫۲ "Appendix E: Block Names" (PDF). The Unicode Standard. Unicode Consortium.صفحه پودمان:Citation/CS1/en/styles.css محتوایی ندارد.
لینک های خارجی[ویرایش]
- وب سایت رسمی کنسرسیوم یونیکد (انگلیسی)
الگو:MathematicalSymbolsNotationLanguage
This article "بلوک یونیکد" is from Wikipedia. The list of its authors can be seen in its historical and/or the page Edithistory:بلوک یونیکد. Articles copied from Draft Namespace on Wikipedia could be seen on the Draft Namespace of Wikipedia and not main one.
This page exists already on Wikipedia. |