KompjûtersYnformaasjetechnology

Kodearring fan tekst ynformaasje yn 'e kompjûter

Kompjûter - in ferfine apparaat dêr't jo meitsje kinne, omsette, en slaan ynformaasje. Lykwols, de computer net wurkje hiel begryplik wei foar ús - grafysk, tekst en numerike gegevens wurdt opslein as binêre rigen nûmers. Yn dit artikel sille wy sjen nei hoe't de kodearring fan de tekst ynformaasje.

Wat foar ús is de tekst fan in kompjûter - in searje fan lettertekens. Elk symboal stiet foar in bepaalde set fan nullen en nijen. Under de symboalen betsjutte net allinnich haad- en lytse letters út it Latynske alfabet, mar ek lêstekens, rekkenjen teikens, spesjale karakters, spesjale symboalen en sels romte.

Binary kodearring of tekstuele ynformaasje

Troch drukken in beskate toets op de ynterne controller stjoerd in elektryske sinjaal dat wurdt omsetten nei in binêr koade. Koade komt mei in bepaalde symboal, dat is werjûn op it skerm. Foar ûnderwerping oan it Latynske alfabet yn in digitale formaat ASCII taalkodearjen yn ynternasjonale systeem is oanmakke. It fereasket 1 byte foar opname ien symboal dus bestiet út acht-symboal searje fan nullen en nijen. De opname tuskenskoft - út 00000000 oant 11111111, dws taalkodearjen fan tekst ynformaasje brûkend dit systeem kinne ús te fertsjintwurdigjen 256 tekens. Yn de measte gefallen, dat is genôch.

ASCII wurdt opdield yn twa parten. De earste 127 karakters (fan 00000000 oant 01111111) binne ynternasjonaal en binne spesifike symboalen en brieven fan it Ingelske alfabet. It twadde part - de ekstinsje (fan 10000000 oant 11111111) - is bedoeld om te fertsjintwurdigjen op de nasjonale alfabet, it skriuwen fan dat oars út it Latyn.

Encoding tekst ynformaasje yn ASCII wurdt boud op it prinsipe fan tanimmende sequence, dat wol sizze, it grutter de folchoarder oantal brieven, it grutter de wearde fan syn ASCII-koade. Figueren en Russyske part fan 'e tafel wurde boud op itselde prinsipe.

Lykwols, yn 'e wrâld binne der ferskate soarten fan kodearring foar Syrillysk letters. De meast foarkommende - is Koi-8 (acht-bit kodearring dat wurdt al foar yn 'e jierren '70 yn de earste ruifitsirovannyh Unix operating system), ISO 8859-5 (ûntwikkele troch de Ynternasjonale standerdisearing Buro), de CP 1251 (taalkodearjen tekstuele ynformaasje brûkt wurdt yn de moderne OS Windows), en ek 2-byte kodearring fan unykoade, dat kin brûkt wurde om te yntrodusearjen 65.536 karakters. Sa'n ferskaat oan yn Weststellingwerf gefolch fan it feit dat sy waarden ûntwikkele op ferskillende tiden, foar oare bestjoeringssystemen en ferskillende oerwegings. Fanwegen dit, faak hawwe swierrichheden doe't it oerdragen fan tekst fan de iene medium nei in oar - fan in mismatch kodear de brûker sil sjogge in set fan betiizjende ikoanen. Hoe kin ik lossen dizze situaasje? Yn Word, bygelyks, doe't der in dokumint wurdt iepene, in berjocht oer problemen mei tekst display en jout ferskate opsjes foar transcoding.

Sa, taalkodearjen en ferwurking fan tekstuele ynformaasje yn 'e kompjûter syn yngewant - it proses is dreech en tiidslinend organisearre. Alle symboalen fan in alfabet binne mar in bepaalde opienfolging fan sifers fan binêre systeem, de iene sel - dat is ien byte fan ynformaasje.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 fy.birmiss.com. Theme powered by WordPress.