upload
The Unicode Consortium
Branche: Computer; Software
Number of terms: 11048
Number of blossaries: 0
Company Profile:
The Unicode Consortium or Unicode Inc. is a not-for-profit organization that coordinates the development of the Unicode standard. Its stated goal is to eventually enable computers to operate in all languages from around the world. The consortium develops and publishes a list of freely-available ...
Znak Unicode U + FEFF pri použití označíte poradie bajt textu.
Industry:Computer; Software
Poradie radov bajtov stanoví architektúra počítačov.
Industry:Computer; Software
Zrušenie rádovo postupnosť bajtov.
Industry:Computer; Software
(1) Zodpovedajúcu všeobecné pravidlá pre kódovanie – t.j. nie komprimované, zhutnenie, alebo v akejkoľvek inej forme špecifikované vyššie protokolom. (2) Charakteristiku normatívne mapovanie a forme rovnocennosti, ktoré sú uvedené v kapitole 3, zhody.
Industry:Computer; Software
Krok algoritmu Unicode štandardizácia formulárov, počas ktorého rozloženého sekvencie sa nahrádzajú primárne kompozitných materiálov, ak je to možné.
Industry:Computer; Software
Počnúc druhým znakom v kódovaných znakov postupnosť (kanonický rozkladu alebo kompatibility rozklad) a konania postupne na konečný charakter, vykonajte nasledovné kroky: R1 hľadať naspäť (šípka doľava) v postupnosť kódovaných znakov od znaku c nájsť posledný Starter L predchádzajúcich c postupnosť znakov. R2 ak takéto l a c nie je blokovaný z l a existuje primárne zložené P, ktoré sa rovná kanonický sekvencii &lt; L, C &gt;, potom nahradiť L P v poradí a odstrániť c z postupnosti. *Ak algoritmus dokončí, všetky Non-blokované párov kanonický zodpovedá primárne zložené bude systematicky nahradili tieto primárne kompozitov. *Nahradenie Starter L v R2 vyžaduje, naďalej skontrolujte nasledujúce znaky, kým znak v tejto polohe už nie je súčasťou akéhokoľvek Non-blokované dvojicu, ktoré môžu byť nahradené za primárne zložené. Napríklad zvážiť nasledujúce postupnosť hypotetický kódovaných znakov: <u>. Žiadny z prvých troch kombinujúcich značky tvorí primárne zložené s listu z. Avšak, štvrtý kombinujúcich známky v sekvencii, akútne, robí forme primárne zložené s z, a nie je blokovaný z z. preto, R2 mandátov nahradenie postupnosti &lt; z U + 007A,... U + 0301 akútnej &gt; s &lt; U + 017A z-akútne,... &gt;, hoci existujú tri kombinujúci značky intervenciou v sekvencii. *Znak C v R1 nie je nevyhnutne non-starter. , Ktoré je potrebné skontrolovať všetky znaky v sekvencii, pretože existujú sekvencie &lt; L, C &gt; kde l a c sa štartérov, ešte je primárne zložené P, čo zodpovedá kanonický poradí. Napríklad indických dvoch častí samohlásky majú často kanonický decompositions do sekvencie obe označenia samohlásky medzery, z ktorých každá má Canonical_Combining_Class &#61; 0 a ktoré je teda Starter podľa definície. Napriek tomu, rozloženého postupnosť má rovnocenné primárne zložené.
Industry:Computer; Software
Znak, ktorý nie je totožný s jeho kanonický rozkladu. , Ktoré môžu byť známe tiež ako kanonický preddefinovaný zložený znak alebo kanonický zložený znak.Latinka – malé písmeno *napríklad U + 00E0 s hrob je znak kanonický decomposable, pretože jeho kanonický rozkladu je postupnosť <u>. U + 212A Kelvin znak je znak kanonický decomposable, pretože jeho kanonický rozkladu je U + 004B latinský písmenom K.
Industry:Computer; Software
Mapovanie svojou podstatou rovnocenné postupnosť — napríklad mapovanie ä na a + kombinuje prehláska. Rozkladu znak alebo postupnosť znakov, ktoré je výsledkom rekurzívne uplatňovania kanonický priradenia nájsť v databáze znak Unicode, kým znaky treba ďalej rozložiť, a potom doobjednávania nonspacing značky. *A kanonický rozkladu neodstráni informácie o formátovaní.
Industry:Computer; Software
Dva postupnosti znakov sú hovorí, že je kanonický ekvivalentov, ak ich plnej kanonický decompositions sú identické. *Sekvencie &lt; o, kombinovanie cigarettes &gt; a &lt;ö&gt; sú napríklad kanonický ekvivalenty. Kanonický rovnocennosti je vlastnosť Unicode. To by sa nemalo zamieňať s jazykoch zoradenie alebo zodpovedajúce, ktoré sa môžu pridať ďalšie equivalencies. Napríklad vo švédčine, ö sa považuje za úplne iný list o a je sústreďované po z. v nemčine, ö je slabo ekvivalentom oe a sa porovnávajú s oe. v angličtine, ö je len o s diakritiku, ktorý naznačuje, že sa vyslovuje oddelene od predchádzajúcich písmeno (ako coöperate) a je porovnávajú s o. *podľa definície, všetky kanonický ekvivalent sekvencie sú tiež kompatibility-ekvivalent sekvencie.
Industry:Computer; Software
V postupnosti rozloženého znak d výmenu pozície znaky páru Reorderable kým postupnosť obsahuje žiadne ďalšie Reorderable párov. *v skutočnosti kanonický objednávanie algoritmus je miestne bubble Radit, ktorý zaručuje, že kanonický rozkladu alebo kompatibility rozkladu bude obsahovať žiadne subsequences, v ktorom značku kombinujúcich nasleduje priamo inou kombináciou značkou, ktorá má nižšie, non-nulové kombinujúcich trieda *Canonical objednávanie definovaný ako uplatňovanie kanonický objednávanie algoritmus na celú rozloženého postupnosť. Napríklad kanonický rozkladu postupnosti <u>by malo mať za následok postupnosť &lt; U + 0064 Latinskej malé písmeno d, U + 0307 kombinujúcich dot vyššie, U + 0323 kombinujúcich dot nižšie &gt;, postupnosti, ktoré kanonický príkaz ešte nie je. Väčšina decompositions reťazcov Unicode sú už v kanonický poradí.
Industry:Computer; Software