ΥπολογιστέςΤης τεχνολογίας των πληροφοριών

Κωδικοποίηση των πληροφοριών κειμένου στον υπολογιστή

Υπολογιστών - μια εξελιγμένη συσκευή με την οποία μπορείτε να δημιουργήσετε, να μετατρέψει, και την αποθήκευση πληροφοριών. Ωστόσο, ο υπολογιστής δεν λειτουργεί πολύ κατανοητό τρόπο για μας - γραφικά, κείμενο και αριθμητικά δεδομένα αποθηκεύονται ως δυαδικά συστοιχίες αριθμούς. Σε αυτό το άρθρο θα εξετάσουμε πώς η κωδικοποίηση των πληροφοριών κειμένου.

Αυτό που για μας είναι το κείμενο ενός υπολογιστή - μια ακολουθία χαρακτήρων. Κάθε σύμβολο αντιπροσωπεύει ένα συγκεκριμένο σύνολο μηδενικά και μονάδες. Σύμφωνα με τα σύμβολα σήμαινε όχι μόνο κεφαλαία και πεζά γράμματα του λατινικού αλφαβήτου, αλλά και σημεία στίξης, αριθμητική πινακίδες, ειδικούς χαρακτήρες, ειδικά σύμβολα και ακόμη και το διάστημα.

Δυαδική κωδικοποίηση των πληροφοριών κειμένου

Πιέζοντας ένα ορισμένο πλήκτρο στην εσωτερική ελεγκτής στέλνει ένα ηλεκτρικό σήμα που μετατρέπεται σε ένα δυαδικό κώδικα. Κωδικός συνδυάζεται με ένα συγκεκριμένο σύμβολο, που εμφανίζεται στην οθόνη. Για την υποβολή στο λατινικό αλφάβητο σε ψηφιακή μορφή ASCII κωδικοποίηση διεθνές σύστημα δημιουργήθηκε. Απαιτεί 1 byte για την καταγραφή ενός συμβόλου έτσι συνίσταται από αλληλουχία οκτώ-σύμβολο της μηδενικά και μονάδες. Το διάστημα καταγραφής - 00000000 - 11111111, δηλαδή κωδικοποίηση των πληροφοριών κειμένου που χρησιμοποιούν αυτό το σύστημα μας επιτρέπει να εκπροσωπεί 256 χαρακτήρες. Στις περισσότερες περιπτώσεις, αυτό είναι αρκετό.

ASCII χωρίζεται σε δύο μέρη. Οι πρώτοι 127 χαρακτήρες (00000000 έως 01111111) τα διεθνή και ειδικά σύμβολα και γράμματα του αγγλικού αλφαβήτου. Το δεύτερο μέρος - η επέκταση (10000000 έως 11111111) - έχει ως στόχο να εκπροσωπεί το εθνικό αλφάβητο, η συγγραφή του οποίου είναι διαφορετικό από το λατινικό.

Κωδικοποίηση πληροφοριών κειμένου σε ASCII είναι χτισμένο στην αρχή της αύξησης της ακολουθίας, δηλαδή, όσο μεγαλύτερος είναι ο αριθμός ακολουθίας των γραμμάτων, τόσο μεγαλύτερη είναι η τιμή του ASCII κωδικό του. Στοιχεία και ρωσικό τμήμα του πίνακα είναι χτισμένη στην ίδια αρχή.

Ωστόσο, στον κόσμο υπάρχουν διάφοροι τύποι κωδικοποίησης για τα κυριλλικά γράμματα. Η πιο συνηθισμένη - είναι KOI-8 (οκτώ-bit κωδικοποίησης η οποία έχει χρησιμοποιηθεί για τη δεκαετία του '70 στην πρώτη ruifitsirovannyh λειτουργικό σύστημα Unix), ISO 8859-5 (που αναπτύχθηκε από το Διεθνές Γραφείο Τυποποίησης), ο CP 1251 (κωδικοποίησης κειμένου πληροφοριών που χρησιμοποιούνται στην σύγχρονο λειτουργικό σύστημα των Windows), καθώς και 2-byte κωδικοποίηση Unicode, το οποίο μπορεί να χρησιμοποιηθεί για την εισαγωγή 65.536 χαρακτήρες. Μια τέτοια ποικιλία από κωδικοποιήσεις οφείλεται στο γεγονός ότι αναπτύχθηκαν σε διαφορετικές χρονικές στιγμές, για διαφορετικά λειτουργικά συστήματα και διαφορετικές εκτιμήσεις. Εξαιτίας αυτού, έχουν συχνά δυσκολίες κατά τη μεταφορά κειμένου από το ένα μέσο στο άλλο - από μια αναντιστοιχία που κωδικοποιεί τον χρήστη, θα δείτε μια σειρά από σύγχυση εικόνες. Πώς μπορώ να διορθώσω την κατάσταση; Στο Word, για παράδειγμα, όταν ένα έγγραφο ανοιχτεί, ένα μήνυμα για τα προβλήματα με την οθόνη κειμένου και προσφέρει πολλές επιλογές για transcoding.

Έτσι, κωδικοποίηση και επεξεργασία των πληροφοριών κειμένου στα σπλάχνα του υπολογιστή - η διαδικασία είναι δύσκολη και χρονοβόρα οργανωμένη. Όλα τα σύμβολα της κάθε αλφαβήτου είναι μόνο μια συγκεκριμένη ακολουθία ψηφίων του δυαδικού συστήματος, ένα κύτταρο - αυτό είναι ένα byte πληροφοριών.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 el.birmiss.com. Theme powered by WordPress.