Υπολογιστές, Της τεχνολογίας των πληροφοριών
Κωδικοποίηση των πληροφοριών κειμένου στον υπολογιστή
Υπολογιστών - μια εξελιγμένη συσκευή με την οποία μπορείτε να δημιουργήσετε, να μετατρέψει, και την αποθήκευση πληροφοριών. Ωστόσο, ο υπολογιστής δεν λειτουργεί πολύ κατανοητό τρόπο για μας - γραφικά, κείμενο και αριθμητικά δεδομένα αποθηκεύονται ως δυαδικά συστοιχίες
Αυτό που για μας είναι το κείμενο ενός υπολογιστή - μια ακολουθία χαρακτήρων. Κάθε σύμβολο αντιπροσωπεύει ένα συγκεκριμένο σύνολο μηδενικά και μονάδες. Σύμφωνα με τα σύμβολα σήμαινε όχι μόνο κεφαλαία και πεζά γράμματα του λατινικού αλφαβήτου, αλλά και σημεία στίξης, αριθμητική πινακίδες, ειδικούς χαρακτήρες, ειδικά σύμβολα και ακόμη και το διάστημα.
Δυαδική κωδικοποίηση των πληροφοριών κειμένου
Πιέζοντας ένα ορισμένο πλήκτρο στην εσωτερική ελεγκτής στέλνει ένα ηλεκτρικό σήμα που μετατρέπεται σε ένα δυαδικό κώδικα. Κωδικός συνδυάζεται με ένα συγκεκριμένο σύμβολο, που εμφανίζεται στην οθόνη. Για την υποβολή στο λατινικό αλφάβητο σε ψηφιακή μορφή ASCII κωδικοποίηση διεθνές σύστημα δημιουργήθηκε. Απαιτεί 1 byte για την καταγραφή ενός συμβόλου έτσι συνίσταται από αλληλουχία οκτώ-σύμβολο της μηδενικά και μονάδες. Το διάστημα καταγραφής - 00000000 - 11111111, δηλαδή κωδικοποίηση των πληροφοριών κειμένου που χρησιμοποιούν αυτό το σύστημα μας επιτρέπει να εκπροσωπεί 256 χαρακτήρες. Στις περισσότερες περιπτώσεις, αυτό είναι αρκετό.
ASCII χωρίζεται σε δύο μέρη. Οι πρώτοι 127 χαρακτήρες (00000000 έως 01111111) τα διεθνή και ειδικά σύμβολα και γράμματα του αγγλικού αλφαβήτου. Το δεύτερο μέρος - η επέκταση (10000000 έως 11111111) - έχει ως στόχο να εκπροσωπεί το εθνικό αλφάβητο, η συγγραφή του οποίου είναι διαφορετικό από το λατινικό.
Κωδικοποίηση πληροφοριών κειμένου σε ASCII είναι χτισμένο στην αρχή της αύξησης της ακολουθίας, δηλαδή, όσο μεγαλύτερος είναι ο αριθμός ακολουθίας των γραμμάτων, τόσο μεγαλύτερη είναι η τιμή του ASCII κωδικό του. Στοιχεία και ρωσικό τμήμα του πίνακα είναι χτισμένη στην ίδια αρχή.
Ωστόσο, στον κόσμο υπάρχουν διάφοροι τύποι κωδικοποίησης για τα κυριλλικά γράμματα. Η πιο συνηθισμένη - είναι KOI-8 (οκτώ-bit κωδικοποίησης η οποία έχει χρησιμοποιηθεί για τη δεκαετία του '70 στην πρώτη ruifitsirovannyh λειτουργικό σύστημα Unix), ISO 8859-5 (που αναπτύχθηκε από το Διεθνές Γραφείο Τυποποίησης), ο CP 1251 (κωδικοποίησης κειμένου πληροφοριών που χρησιμοποιούνται στην
Έτσι, κωδικοποίηση και επεξεργασία των πληροφοριών κειμένου στα σπλάχνα του υπολογιστή - η διαδικασία είναι δύσκολη και χρονοβόρα οργανωμένη. Όλα τα σύμβολα της κάθε αλφαβήτου είναι μόνο μια συγκεκριμένη ακολουθία ψηφίων του δυαδικού συστήματος, ένα κύτταρο - αυτό είναι ένα byte πληροφοριών.
Similar articles
Trending Now