BilgisayarlarBilgi teknolojisi

Kodlama "Unicode": karakter kodlama standardı

bir girişim Her internet kullanıcısı birini kurmak veya fonksiyonunun diğer en az bir kere yazılı ekranda gördüğümüz Latince harflerle kelime "Unicode". bunu ne, bu makaleyi okuyarak öğreneceksiniz.

tanım

Kodlama "Unicode" - karakter kodlama standardı. Bu Unicode Inc kar amacı gütmeyen kuruluş tarafından önerilmişti 1991 yılında. Standart bir belgede karakterlerin farklı türde olası en büyük sayı araya getirmek üzere tasarlanmıştır. bunların temelinde kurulmuştur Sayfa, (Korece Rusça'ya) farklı dil ve matematiksel işaretler mektuplar ve karakter içerebilir. Bu durumda, karakter kümesindeki tüm karakterler sorunsuz görüntülenir.

yaratılması için nedenleri

Bir zamanlar, uzun tek bir sistem ortaya çıkmasından önce "Unicode" kodlama belgenin yazarı tercihlerine göre seçilir. Bu nedenle, genellikle bir belgeyi okumak için, farklı tablo kullanmak için gerekliydi. Bazen büyük ölçüde ortalama bir kullanıcı ömrünü zorlaştırmaktadır birkaç kez yapmak gereklidir. Daha önce bahsedildiği gibi, 1991 yılında bu sorunun çözümü karakter kodlaması yeni bir tür sunmak için Unicode Inc. kar amacı gütmeyen bir organizasyon davet edildi. Bu modası geçmiş ve standartların çeşitli birleştirmek için tasarlanmıştır. "Unicode" - anda düşünülemez elde ozvolila bir kodlama: karakter çok sayıda destekleyen bir araç yaratmak için. Sonuç pek beklentilerimin - Aynı anda İngilizce ve Rusça metin, Latin ve matematiksel ifadeler hem içeren belgeler vardı.

Ama oluşturma birleşik bir kodlama öncesinde tarafından ihtiyacı için çözümlenir sayı problemleri buna sahip İleride seçimlerin nedeniyle çok çeşitli standartları zaten varolan o zaman. Bunlardan en yaygın:

  • Elf yazma, ya da "anlamsız";
  • karakter kümesi sınırlamaları;
  • Sorun codings dönüşümü;
  • yazı çoğaltma.

Küçük tarihsel excursus

yarda 80. düşünün. Bilgisayar donanımı çok yaygın değildir ve bugünden farklı bir forma sahiptir. Her işletim sistemi tektir ve her meraklısı'nın özel ihtiyaçlarını rafine ederken. bilgi alışverişi için Need ek bir yeniden işleme herşeyi dönüştürülür. başka bir işletim sistemi tarafından oluşturulan bir belgeyi okumak için çalışılıyor, genellikle karakterlerin garip kümesi görüntüler ve oyun kodlama ile başlar. Her zaman çabuk bunu yapmaz ve bazen gerekli belge açılamıyor bile sonradan altı ay içinde açmak üzere. Sık sık kendileri için bir dönüşüm tablosu oluşturmak, bilgi alışverişinde insanlar. ileri geri "sizin benim itibaren" iki yönde bunları oluşturmak için ihtiyaç: Onları ilginç bir ayrıntı ortaya üzerinde Sonra çalışırlar. ama tersi, sonuç - kaynağının sağ sütunda bunun için, banal inversiyon bilgi işlem makinası olamaz olun ve sol. Eğer ihtiyaç belgede özel karakterler kullanmaya görürlerse ilk eklenecek vardı ve daha sonra başka ve o olmazlar bu karakterlere yapması gerekenlerin ortağına açıklamak "anlamsız." Ve diyelim değil unutmak için her kodlama vardı o kadar geliştirmek veya uygulamak onların kendi yazı tipi, hangi led için oluşturma kalan çok sayıda tekrarı halinde OS.

sayfadaki yazı tipleri, küçük not ile özdeş Times New Roman 10 adet göreceği başka düşünün: UTF-8 için, UTF-16, ANSI, UCS-2. Şimdi evrensel standartların gelişmesi için zorunlu olduğunu anlıyorum?

"Yaratıcılarından kurucuları"

Lee Collins ve Apple Mark Davis ile birlikte Xerox'tan Dzho Bekker, evrensel bir karakter kümesi pratik yaratılış alanında araştırma başladığında Unicode oluşturulması kökenleri 1987 yılında bulunacak. Ağustos 1988 yılında Dzho Bekker 16 bit çok dilli uluslararası kodlama sisteminin oluşturulması için bir öneri taslağını yayınladı.

Birkaç ay sonra Unicode çalışma grubu ortak bir kodlama standardının ön oluşumu çalışmalarının tamamlandığını sağlayan RLG Ken Whistler ve Mike Kernegana, Sun Microsystems ve diğer bazı uzmanlar Glenn Rayt kapsayacak şekilde genişletilmiştir.

genel açıklama

Unicode sembolü kavramına dayanır. Bu tanım, bir Grapheme (kendi "portreler") içinden yazma belirli bir biçimde ve fark soyut olayını belirtir altında. Her karakter, belirli bir birim standardına ait "Unicode" benzersiz kod verilmiştir. Örneğin sesletim B İngilizce ve Rusça alfabeleri ile de, ancak Unicode 2 farklı karakterler karşılık gelir. Bu dönüşüm tabi küçük harf, anahtar veritabanına tarif her hangi t., E., özellikleri bir resim ve tam adı.

Unicode Faydaları

"UNICODE" kodlayan diğer çağdaşlarının itibaren "şifreleme" karakterleri için işaretler muazzam stok yoktur. selefleri 8 bit olduğu gerçeği, yani 28 karakter tarafından desteklenir, ancak yeni tasarım yani dev bir adım olduğunu, zaten 216 karakter oldu. Buna izin kodlamak hemen hemen tüm mevcut ve yaygın alfabeler.

"Unicode" gelişiyle birlikte artık dönüşüm tablosunu kullanmak gerekir: bu sadece onlar için ihtiyaç reddedildiği tek standart olarak. Tek bir standart yinelenen fontları yaratmak için ihtiyaç dışarı onları imkansız, hem de kural yaptı - Aynı şekilde unutulmaya yüz tutmuş olan, ve "anlamsız".

Unicode gelişimi

Tabii ki, ilerleme yerinde değildir ve bu yana ilk sunumu 25 yıldır geçti. Ancak, charset "Unicode" inatla dünyada konumunu korur. Gelen birçok yolu bu kuruldu mu yapmış olabileceği sayesinde Gerçek şu ki o olabilmek kolay uygulanması ve HAS yayılması, varlık tanınan geliştiriciler tescilli (ücretli) ve açık kaynak yazılımı.

Biz bir asır önce çeyrek ile aynı kod "Unicode" bakın bugün inanmak gerekir. Şu anda, bu versiyon 5.h.h ile ikame edilmiştir, ve kodlanmış sembol sayısı hala Unicode 16 için destek sağlamak üzere işaretleri reddeden daha büyük bir marj ile olasılığı üzerinde 231. yükselmiştir (kodlama, burada, sınırlı sayıda 216 maksimum miktar). Kuruluşundan bu yana ve sürüm 2.0.0 kadar "Unicode Standardı" neredeyse 2 kat dahil karakter sayısı artmıştır. Büyüme fırsatları ve devamı müteakip yıl. sürümü 4.0.0 için zaten orada standardını kendisi artırmak için bir ihtiyaçtır ve bu yapıldı. Sonuç olarak, "Unicode" bugün bildiğimiz hangi formu bulmuştur.

Unicode başka nedir?

engin ek olarak, sürekli karakter sayısı ile güncellenen "Unicode" -Encoding metin bilgileri başka yararlı bir özelliktir. Bu sözde normalizasyonudur. Aksine karakteriyle tüm belge karakteri ilerlemek ve yazışmalar tablonun simgeler yerine daha mevcut normalleşme algoritmalar birini kullanın. Bu nedir?

Bunun yerine özel bir algoritma kullanarak, farklı alfabelerle benzer olabilir aynı karakteri, düzenli bir çek üzerindeki bilgisayarın kaynaklarını israf. Size benzer semboller ayrı sütun arama tablosu yapmak ve tüm verileri yeniden kontrol etmek için tekrar değil, tekrar tekrar onlara zaten uygulamanızı sağlar.

Böyle algoritmalar geliştirdi ve dört uygulanmaktadır. Her dönüşüm böylece bunlardan herhangi biri mümkün olan en verimli değildir çağırmak için, diğerinden farklı kesinlikle kesin prensibi ile gerçekleşir. özel ihtiyaçları için tasarlanmış her biri gömülü ve başarılı bir şekilde kullanılmıştır.

Yaygınlaştırma standart

onun geçmişi kodlama "UNICODE" 25 yılda, belki de dünyanın en yaygın aldık. Bu standarda altında programlar ve web sayfaları olarak ayarlanır. Uygulamanın genişlik Unicode artık Internet kaynaklarının% 60'dan fazla kullandığı gösterebilir.

"Unicode" standart ortaya çıktığında Şimdi, biliyorum. Nedir, ayrıca biliyor ve uzmanlar Unicode Inc.'in bir grup tarafından yapılan buluşun tam önemini takdir edebilmek Fazla 25 yıl önce.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 tr.birmiss.com. Theme powered by WordPress.