Hogyan kódolják a betűket a bináris rendszerben. Mi az a bináris kód? Hogyan nézhetnek ki a szöveges információk a számítógép memóriájában

Programozás

Szöveges információ bináris kódolása

A 60-as évek vége óta a számítógépeket egyre gyakrabban használják szöveges információk feldolgozására, és ma már a legtöbb személyi számítógépek a világban (és legtöbbször) a szöveges információk feldolgozása foglalja el.

Hagyományosan egy karakter kódolásához 1 bájtnak megfelelő információmennyiséget használnak, azaz I \u003d 1 bájt \u003d 8 bit.

A nigériai Emmanuel megkérdezi: "Hogyan alakítják át a betűket bináris kódokká?". Ha igen, akkor nagyszerű kérdést tesz fel, mert a betűk átalakításának kérdését ott nem igazán magyarázzák meg. A nagy kérdés: "Hogyan lehet betűt számmá alakítani?" Mert ha egy betűt számmá tud alakítani, akkor az alapvető konverziós oldalunkon található információk segítségével ezt a számot binárissá alakíthatja. Tehát hogyan konvertál a számítógép betűből számmá?

Minden karakternek ugyanannyi bináris bittel kell rendelkeznie – különben senki sem fogja tudni, hol végződik az egyik karakter, és hol kezdődik a következő. Minden négy dátum közé szóközt teszünk, ugyanezért teszünk tíz vesszőt – ez segít könnyebben elolvasni a hosszú számsorokat.

Egy karakter kódolásához 1 bájt információ szükséges.

Ha a szimbólumokat lehetséges eseményeknek tekintjük, akkor a (2.1) képlet segítségével kiszámíthatjuk, hogy hány különböző szimbólum kódolható:

N = 2 I = 28 = 256.

Ez a karakterszám elég a szöveges információk megjelenítéséhez, beleértve az orosz és latin ábécé kis- és nagybetűit, számokat, jeleket, grafikus szimbólumokat stb.

Oké, mostantól csak tudnunk kell, hogy mely betűket melyik szám jelöli. Íme egy rövid hivatkozás az Ön számára. Ez azt jelenti, hogy a kisbetűknek más szám van hozzárendelve, mint a nagybetűké. Most néhány dologra gondolhat, például "Mi történik 65 éves kor előtt?" és "Miért van hézag a kis- és nagybetűk között?".

Az első kérdésre a válasz az, hogy ezekben a szóközökben más karakterek is vannak - számok, írásjelek, speciális vezérlőkarakterek. A kis- és nagybetűs ábécé közötti különbség az az oka, hogy a „32” több, mint az „A.”. Ez nagyon praktikus, mert a 32 a 2 hatványa, tehát a kis- és nagybetűk közötti váltás csak egy bit változást jelent.

A kódolás az, hogy minden karakterhez egyedi decimális kód van hozzárendelve 0 és 255 között, vagy ennek megfelelő bináris kód 00000000-től 11111111-ig. Így az ember a karaktereket stílusuk alapján, a számítógép pedig a kódjaik alapján különbözteti meg.

Amikor szöveges információt viszünk be a számítógépbe, az bináris kódolás, a karakterkép bináris kódjává alakul. A felhasználó megnyom egy szimbólumot a billentyűzeten, és nyolc elektromos impulzusból álló sorozat (a szimbólum bináris kódja) belép a számítógépbe. A karakterkód tárolva van véletlen hozzáférésű memória számítógépre, ahol egy bájtot foglal el.

Miért akarod ezt megtenni? Nos, valószínűleg nem tenné, ha nem akarna helyet spórolni, és nem törődne semmi mással, mint az alapvető nagybetűs ábécével. Látod, ha csak a nagybetűk érdekelnek, akkor ezt az átalakítást így is megteheted.

Hangok bináris kódolása

Mert most a legnagyobb kódolandó szám a 26, ami kevesebb, mint 25. Ez azt jelenti, hogy nyolc helyett csak öt számjegyre van szüksége minden szám írásához! Körülbelül az oldalterület 38%-át takaríthatja meg. Mivel 32 karakteres helynek kell lennie a táblázatban, és csak legfeljebb 26 karaktert használt, használhat másokat is. Talán vannak írásjelek?

A karakter számítógép képernyőjén történő megjelenítése során fordított folyamatot hajtanak végre - dekódolást, vagyis a karakterkódot képpé alakítják.

Fontos, hogy egy adott kód hozzárendelése egy szimbólumhoz megegyezés kérdése, amit a kódtáblázatban rögzítünk. Az első 33 kód (0-tól 32-ig) nem karaktereknek, hanem műveleteknek felel meg (soremelés, szóközbevitel stb.).

Miért használ egy számítógép bináris kódot?

Vagy létrehozhat egy 64 karakterből álló táblázatot, amely lehetővé teszi sokkal több írásjel, szám vagy kisbetűs ábécé hozzáadását. De most hat bináris számjegyet használ karakterenként, így nem takarít meg annyi helyet.

Vagy teljesen elronthatja a karakterdiagramját, megnehezítve mások számára a dekódolást. Olyan, mint egy számítógép több villanykapcsolóval, és minden villanykapcsoló csak egy izzót vezérel. Tegyük fel, hogy volt két villanykapcsolója. Van négy különböző utak amellyel ezeket a kapcsolókat megfordíthatnánk.

A 33-tól 127-ig terjedő kódok nemzetköziek, és megfelelnek a latin ábécé karaktereinek, számoknak, jeleknek aritmetikai műveletekés írásjelek.

A 128-tól 255-ig terjedő kódok nemzetiek, vagyis a nemzeti kódolásokban különböző karakterek felelnek meg ugyanannak a kódnak. Sajnos jelenleg öt különböző kódtábla létezik az orosz betűkhöz (KOI8, СР1251, СР866, Mac, ISO - 1.3 táblázat), így az egyik kódolásban létrehozott szövegek nem jelennek meg megfelelően a másikban.

A bináris ezeknek a kombinációknak mindegyikét veszi, és hozzárendel egy számot, pl. Ha egy másik izzóhoz adnánk, akkor kétszer akkora lenne, mint a 2. mutató. Ekkor, ha az összes izzó benne lenne, a pont értéke 4 2 1 = És ha egy másik izzóhoz adnánk, 8 pontra tennénk. Amint látja, egy igazán nagy szoba kialakításához sok villanykörte kell!

Végül, bár ezeknek az izzóknak minden egyes pontértéket adunk, amikor leírjuk őket, továbbra is csak egyesekként és nullákként írjuk le őket. Az egyik azt jelenti, hogy be, a nulla pedig kikapcsolt. Tegyük fel, hogy 8 izzónk volt, és így lettek beállítva.

Jelenleg egy új nemzetközi szabvány Unicode, ami nem egy bájtot foglal le minden karakterhez, hanem kettőt, így nem 256 karaktert, hanem N = 216 = = 65536 különböző karaktert lehet kódolni vele. Ez a kódolás támogatott legújabb verziói Microsoft Windows&Office platformok (1997 óta).

Minden kódolást saját kódtáblázat határoz meg. Amint az a táblázatból látható. 1.3-ban különböző karakterek vannak hozzárendelve ugyanahhoz a bináris kódhoz különböző kódolásokban.

Ennek a nyolc lámpának a pontértékei. Ezért azt mondanánk, hogy az izzók sorrendje megéri. Menjen előre, és írja be a szöveget a kódolóba. A számítógép ezeket a betűket számokká alakítja, majd binárissá alakítja! Tudtad, hogy 8 izzó kell ahhoz, hogy bármilyen betűt leírjunk a számítógépen? Tehát egy 5 betűs szóhoz 40 izzó kell! Szerinted hány izzóval készül el ez az oldal?

Hogyan nézhetnek ki a szöveges információk a számítógép memóriájában?

A számítógépen belüli összes adatot elektromos jelek sorozataként továbbítják, amelyek be- vagy kikapcsolva vannak. Ezért ahhoz, hogy a számítógép feldolgozhasson bármilyen adatot, beleértve a szöveget, a képeket és a hangokat is, azokat formává kell alakítani. Ha az adatokat nem konvertálja binárissá - 1-es és 0-s sorozat -, a számítógép egyszerűen nem fogja megérteni, vagy nem tudja feldolgozni.

Például a 221, 194, 204 numerikus kódok sorozata a CP1251 kódolásban a "számítógép" szót alkotja, míg más kódolásokban értelmetlen karakterkészlet lesz.

Szerencsére a legtöbb esetben a felhasználónak nem kell aggódnia az újrakódolás miatt szöveges dokumentumok, mivel ezt speciális, alkalmazásokba épített konvertáló programok teszik.

Ha a billentyűzet bármely billentyűjét megnyomják, azt bináris számmá kell alakítani, hogy a számítógép feldolgozhassa, és egy tipikus karakter jelenjen meg a képernyőn. Egy olyan kód, amelyben minden szám egy karaktert jelöl, használható szöveg binárissá alakítására. Egy kódot hívnak meg, amellyel ezt megtehetjük.

Ha ékezeteket szeretne használni az európai nyelveken vagy nagyobb írásokat, például cirill és kínai mandarin, több karakterre van szüksége. Tehát egy másik kód jött létre, melynek neve. Ez azt jelentette, hogy a számítógépeket különböző nyelveket használó emberek használhatták.

A numerikus karakterkód meghatározása

1. Indítsa el az MS Word 2002 szövegszerkesztőt. Írja be az [Insert-Symbol...] parancsot. Egy párbeszédpanel jelenik meg a képernyőn. Szimbólum. A párbeszédpanel középső részét egy adott betűtípus (például Times New Roman) karaktertáblázata foglalja el.

A karakterek egymás után balról jobbra és soronként vannak elrendezve, a karakterrel kezdve Tér a bal felső sarokban és a táblázat jobb alsó sarkában az "i" betűvel végződve.

Szöveges információ bináris kódolása

7 bites karakterkészlet az angol billentyűzet karaktereinek megjelenítésére. egy bináris számrendszer, amely két számjegyet, 0-t tartalmaz, és más néven alapbit. Módszer a fájlméret csökkentésére, különösen digitális adathordozókon, például fényképeken, hangokon és videókon. adatok Az információ mértékegységei. A számításokban különböző típusú adatok lehetnek, beleértve az egész számokat, karaktereket és logikai értékeket. Az emberek által leggyakrabban használt számrendszer. 10 egyedi számjegyet tartalmaz 0-tól a decimális vagy alapvető numerikus információig, amelyeket diszkrét értékként tárolnak, általában számok formájában. Ez egy olyan adathalmaz, amely más adatokat ír le és ad tájékoztatást. Kompatibilis a legtöbb médialejátszóval. Mozgókép-szakértők egy csoportja fejlesztette ki – Layer Pixel. A képelem egyetlen színes pont a digitális bittérképen vagy a számítógép képernyőjén. engedély. A képen látható részletek mennyisége - minél nagyobb a kép felbontása, annál több részlet jelenik meg. Mérése pont per hüvelykben történik. mintavételi ráta. Hány adatminta érkezik másodpercenként. Ezt általában hertzben mérik, például egy hangfájl általában 1 kHz-es mintákat használ. A kódolás során, amikor a számokat, betűket vagy szavakat egy meghatározott karaktercsoport képviseli, a szám, betű vagy szó kódoltnak minősül.

Válasszon ki egy szimbólumot és a legördülő listából tól től: kódolás típusa. Szöveges mezőben Aláírási kód: megjelenik a numerikus kódja.

Karakterek bevitele numerikus kóddal

1. Futtassa a szabványos programot Jegyzetfüzet. A kiegészítő számbillentyűzet használatával, miközben lenyomva tartja az (Alt) billentyűt, írja be a 0224-es számot, majd engedje fel a billentyűt (Alt). Az "a" szimbólum megjelenik a dokumentumban. Ismételje meg az eljárást a 0225 és 0233 közötti numerikus kódok esetében. A dokumentumban 12 „abcgdej” karakterből álló sorozat jelenik meg Windows kódolásban (CP1251).

A karakterek egy csoportját kódnak nevezzük. A digitális adatokat bináris bitek csoportjaként ábrázolják, tárolják és továbbítják. Ezt a csoportot bináris kódnak is nevezik. A bináris kódot egy szám és egy alfanumerikus betű jelöli. Az alábbiakban felsoroljuk a binárisan kínált előnyöket.

Bináris kódok osztályozása

A bináris kódok elemzést és tervezést végeznek digitális áramkörök ha bináris kódokat használunk.

A bináris kódok alkalmasak számítógépes alkalmazásokhoz.
A bináris kódok alkalmasak digitális kommunikációra.

A kódokat nagyjából négy kategóriába sorolják. Bináris kódolású decimális kód Alfanumerikus kódok Hibakódok hibajavítással Javító kódok. A súlyozott bináris kódok olyan bináris kódok, amelyek engedelmeskednek a pozíciósúly elvének. A szám minden pozíciója egy bizonyos súlyt jelent.

2. A kiegészítő numerikus billentyűzet segítségével az (Alt) billentyű lenyomva tartása mellett írja be a 224-es számot, a "p" szimbólum megjelenik a dokumentumban. Ismételje meg az eljárást a 225-től 233-ig terjedő numerikus kódokhoz, és egy 12 karakterből álló "rstufhtschshsch" szekvencia jelenik meg MS-DOS kódolásban (CP866) a dokumentumban.

Gyakorlati feladatok

Előjeles törtszámok

Számos kódrendszert használnak a decimális számjegyek 0-tól való kifejezésére. Ezekben a kódokban mindegyik decimális számjegy négy bitből álló csoport képviseli. Az ilyen típusú bináris kódokban nincs pozicionális súlyozás hozzárendelve. Ez a súlyozatlan kód, amelyet a kifejezésre használnak decimális számok. A redundancia-3 kódokat a következőképpen kapjuk meg.

Ez egy súlyozatlan kód, és ezek nem aritmetikai kódok. Ez azt jelenti, hogy a bitpozícióhoz nincsenek specifikus súlyok hozzárendelve. Van egy nagyon különleges tulajdonsága: csak egy bit változik minden alkalommal, amikor a decimális számot növeljük, amint az az 1. ábrán látható. Mivel egyszerre csak egy bit változik, a szürke kódot egyetlen távolságkódnak hívják. A szürke kód ciklikus kód. A sorozatkód nem használható aritmetikai műveletekhez.

1.29. Egy karaktertáblázat (MS Word) segítségével írja le a „számítógép” szóhoz egy decimális numerikus kódsorozatot Windows-kódolásban (CP1251).

1.30. A Jegyzettömb segítségével határozza meg, hogy a Windows-kódolásban (CP1251) melyik szót adja meg a numerikus kódok sorozata: 225, 224, 233,242.

1.31. Milyen betűsorozatok felelnek meg a KOI8 és ISO kódokban a CP1251 kódolással írt "számítógép" szónak?

Bináris kódolású decimális kód

A tengelyhelyzet-érzékelő kódszót generál, amely a tengely szöghelyzetét jelzi. A szürke kódot széles körben használják a tengelykódolókban. . Ebben a kódban minden decimális számjegyet egy 4 bites bináris szám képvisel.

Nagyon hasonlít a decimális rendszerhez.
Csak a 0-tól 9-ig tartó decimális számok bináris megfelelőjére kell emlékeznünk.

Egy bináris számjegy vagy bit csak két karaktert jelenthet, mivel csak két állapota van 0 vagy 1. De nem elég két számítógép között kommunikálni, mert több karakterre van szükség a kommunikációhoz.

A számítógép nagy mennyiségű információt dolgoz fel. Hangfájlok, képek, szövegek – mindezt le kell játszani vagy megjeleníteni a képernyőn. Miért van a bináris kódolás univerzális módszer bármilyen technikai berendezés programozási információi?

Miben különbözik a titkosítás a titkosítástól?

Az emberek gyakran egyenlőségjelet tesznek a "kódolás" és a "titkosítás" fogalmai között, holott valójában eltérő jelentéssel bírnak. Így a titkosítás az információ átalakításának folyamata annak elrejtése érdekében. A szöveget megváltoztató személy vagy speciálisan képzett emberek gyakran meg tudják fejteni. A kódolás az információk feldolgozására és a vele végzett munka egyszerűsítésére szolgál. Általában egy közös kódolási táblázatot használnak, amely mindenki számára ismerős. A számítógépbe is be van építve.

Ezeknek a karaktereknek a 26 ábécét kell képviselniük kis- és nagybetűkkel, 0-tól 9-ig terjedő számokkal, írásjelekkel és egyéb szimbólumokkal. Az alfanumerikus kódok olyan kódok, amelyek számokat és alfabetikus karaktereket jelentenek. A legtöbb esetben az ilyen kódok más szimbólumokat is képviselnek, például egy karaktert és különféle utasításokat, amelyek az információ továbbításához szükségesek. Az alfanumerikus kódnak legalább 10 számjegyet és 26 betűt kell tartalmaznia az ábécéből, pl. összesen 36 elem. A következő három alfanumerikus kódot nagyon gyakran használják az adatok ábrázolására.

Képek kódolása bináris kódba

Ezt az információkódoló rendszert binárisnak nevezik. Ez egy olyan kódolási forma, amely lehetővé teszi a számítógépek működését. A bináris kód két állapotot használ az információ kódolására. Ezt "tizedes alapnak" nevezik. Azonban a régebbi civilizációk, sőt egyes modern alkalmazások is más számbázisokat használnak és használnak.

A bináris kódolás elve

A bináris kódolás csak két karakter – 0 és 1 – használatán alapul a felhasznált információk feldolgozásához különféle eszközök. Ezeket a jeleket bináris számjegyeknek, angolul bináris számjegyeknek vagy biteknek nevezték. Minden karakter 1 bitet foglal el a számítógép memóriájában. Miért univerzális információfeldolgozási módszer a bináris kódolás? A lényeg az, hogy a számítógép könnyebben tud kevesebb karaktert feldolgozni. A számítógép termelékenysége közvetlenül ettől függ: minél kevesebb funkcionális feladatot kell végrehajtania egy eszköznek, annál gyorsabb és jobb a munka.

A bináris kódolás elve nem csak a programozásban található meg. A váltakozó süket és hangos dobütések segítségével Polinézia lakói információkat közvetítettek egymásnak. Hasonló elv érvényesül, amikor hosszú és rövid hangokat használnak üzenet közvetítésére. A "távíró ábécé" ma is használatos.

Hol használják a bináris kódolást?

A bináris mindenütt jelen van a számítógépekben. Minden fájlt, legyen az zene vagy szöveg, úgy kell programozni, hogy később könnyen feldolgozható és olvasható legyen. A bináris kódrendszer hasznos szimbólumokkal és számokkal, hangfájlokkal, grafikákkal való munkához.

Számok bináris kódolása

Most a számítógépekben a számokat olyan kódolt formában jelenítik meg, amely egy hétköznapi ember számára érthetetlen. Az arab számok használata, ahogy elképzeljük, irracionális a technológia szempontjából. Ennek az az oka, hogy minden számhoz egyedi szimbólumot kell rendelni, ami néha lehetetlen.

Két számrendszer létezik: pozicionális és nem pozíciós. A nem poziciós rendszer a latin betűk használatán alapul, és számunkra ismerős formában Ez az írásmód meglehetősen nehezen érthető, ezért elhagyták.

A helyzetszámrendszert ma is használják. Ez magában foglalja az információk bináris, decimális, oktális és még hexadecimális kódolását is.

A mindennapi életben a decimális kódrendszert használjuk. Ezek megszokottak számunkra, amelyek mindenki számára világosak. A számok bináris kódolása csak a nulla és az egy használatában különbözik.

Az egész számokat 2-vel osztva alakítjuk át a bináris kódrendszerbe. A kapott hányadosokat szintén fokozatosan osztjuk 2-vel, amíg az eredmény 0 vagy 1 nem lesz. Például a 123 10 kettes számrendszer 1111011 2-ként ábrázolható. A 20 10 szám pedig 10100 2-nek fog kinézni.

A 10-es és 2-es indexeket a számok decimális és bináris kódrendszere jelöli. A bináris karaktert a különböző számrendszerekben ábrázolt értékekkel való munka megkönnyítésére használják.

A decimális programozási módszerek a „lebegőponton” alapulnak. Az érték decimálisról bináris kódrendszerre történő helyes konvertálásához használja az N = M x qp képletet. M a mantisza (egy számnak minden sorrend nélküli kifejezése), p az N értékének sorrendje, q pedig a kódrendszer alapja (esetünkben 2).

Nem minden szám pozitív. A pozitív és negatív számok megkülönböztetése érdekében a számítógép 1 bitnek hagy helyet az előjel kódolásához. Itt a nulla a pluszjelet, az egyes pedig a mínuszjelet jelöli.

Egy ilyen számrendszer használata megkönnyíti a számítógép számára a számokkal való munkát. Ezért a bináris kódolás univerzális a számítási folyamatokban.

Szöveges információ bináris kódolása

Az ábécé minden karakterét saját nullák és egyesek kódolják. A szöveg különböző karakterekből áll: betűkből (kis- és nagybetűk), számtani jelekből és számos egyéb értékből. A szöveges információk kódolásához 8 egymást követő bináris érték használatára van szükség 00000000 és 11111111 között. Ily módon 256 különböző karakter konvertálható.

A szövegkódolási zavarok elkerülése érdekében minden karakterhez speciális értéktáblázatokat használnak. Tartalmazzák a latin ábécét, számtani jeleket és speciális jeleket (például €, ¥ és mások). A 128-255 közötti hézagkarakterek az ország nemzeti ábécéjét kódolják.

1 karakter kódolásához 8 bit memória szükséges. A számítások egyszerűsítése érdekében 8 bit egyenlő 1 bájttal, így a szöveges információk teljes lemezterületét bájtokban mérik.

A legtöbb személyi számítógép szabványos ASCII (American Standard Code for Information Interchange) kódolási táblázattal van felszerelve. Más táblázatokat is használnak, amelyekben más a szöveges információ kódolási rendszere. Például az első ismert karakterkódolást KOI-8-nak (8 bites információcsere kód) hívják, és UNIX-ot futtató számítógépeken működik. Szintén széles körben megtalálható a CP1251 kódtábla, amelyhez készült operációs rendszer Ablakok.

Hangok bináris kódolása

A másik ok, amiért a bináris kódolás olyan sokoldalú módszer az információk programozására, az az egyszerű használat, amikor hangfájlokkal dolgozunk. Bármilyen zene különböző amplitúdójú és frekvenciájú hanghullámok. A hang hangereje és hangmagassága ezektől a paraméterektől függ.

A hanghullám programozásához a számítógép feltételesen több részre, vagy „mintára” osztja azt. Az ilyen minták száma nagy lehet, így 65536 különböző nullák és egyes kombinációk állnak rendelkezésre. Ennek megfelelően a modern számítógépek 16 bites hangkártyákkal vannak felszerelve, ami azt jelenti, hogy 16 bináris számjegyből kell kódolni egy hanghullámmintát.

Egy hangfájl lejátszásához a számítógép feldolgozza a bináris kód programozott sorozatait, és egyetlen folyamatos hullámmá egyesíti őket.

Grafikus kódolás

A grafikus információk rajzok, diagramok, képek vagy diák formájában jeleníthetők meg a PowerPointban. Bármely kép kis pontokból - pixelekből áll, amelyek különböző színekkel festhetők. Az egyes pixelek színét kódoljuk és tároljuk, és ennek eredményeként teljes értékű képet kapunk.

Ha a kép fekete-fehér, az egyes pixelek kódja lehet egy vagy nulla. Ha 4 színt használunk, akkor mindegyik kódja két számjegyből áll: 00, 01, 10 vagy 11. Ezen elv alapján bármely kép feldolgozási minősége megkülönböztethető. A fényerő növelése vagy csökkentése a felhasznált színek számát is befolyásolja. A legjobb esetben a számítógép körülbelül 16 777 216 árnyalatot különböztet meg.

Következtetés

Az információ programozásának különféle módjai vannak, amelyek közül a bináris kódolás a leghatékonyabb. Mindössze két karakterrel – 1 és 0 – a számítógép könnyedén be tudja olvasni a legtöbb fájlt. Ugyanakkor a feldolgozási sebesség sokkal nagyobb, mint pl. decimális rendszer programozás. Ennek a módszernek az egyszerűsége miatt minden technikához nélkülözhetetlen. Ez az oka annak, hogy a bináris kódolás univerzális a megfelelői között.