Showing posts with label doc. Show all posts
Showing posts with label doc. Show all posts

Sunday, December 20, 2020

Ο Δαίμων του Τυπογραφείου Μεταλλάχθηκε σε Ψηφιακό

Για να παραφράσω την αθάνατη ελληνική ταινία, «σύνταξη/δακτυλογράφηση, στοιχειοθεσία, εκτύπωση, τρία σκαλοπάτια. Σύνταξη/δακτυλογράφηση, σώσιμο, επισύναψη, αποστολή, εισαγωγή, ανάρτηση, έξι σκαλοπάτια»… Ο «δαίμων του τυπογραφείου» υπήρξε (και είναι ακόμα) η εξήγηση για πάμπολλα σφάλματα στην τυπογραφία. Στην ψηφιακή εκδοχή της, όχι απλώς αυξήθηκαν τα βήματα, αλλά τα δυνητικά σφάλματα σε κάποια από αυτά οφείλονται κυριολεκτικά στον «ψηφιακό δαίμονα», καθώς δεν γίνονται απαραίτηα από ανθρώπινο χέρι, αλλά και από αδυναμίες στο λογισμικό, που δεν έχουν βρεθεί και διορθωθεί ακόμα.

 Το πρόβλημα είναι η απουσία ένδειξης σφάλματος…
Αντιγράφω απόσπασμα από σχόλιο στο Facebook, σχετικά με ανάρτηση σε ιστοσελίδα που έγινε βάσει ενός εγγράφου που παραλήφθηκε με email, αλλά είχε μια «κρυμμένη» παράγραφο (την τελευταία και… φαρμακερή), η οποία έμεινε εκτός ανάρτησης, προκαλώντας μια, βραχύβια, ευτυχώς, παρεξήγηση:

«Το κείμενο εστάλη […] συνημμένο σε μορφή word 97-2003. Ανοίχθηκε από Microsoft Office 365 (desktop), από όπου και αναρτήθηκε ολόκληρο (605 λέξεις). Έρευνα μετά το συμβάν έδειξε ότι αν ανοιχθεί από Microsoft Office 2016 και 2019 εμφανίζονται επίσης 605 λέξεις. Αν ανοιχθεί από Microsoft Office 2007 ή Libre Office 7.0 το κείμενο εμφανίζεται με μια παράγραφο παραπάνω και σύνολο 781 λέξεις»

Περιγράφεται ένα πολύ σπάνιο φαινόμενο, που ασφαλώς συνέβη υπό πολύ ιδιαίτερες συνθήκες δυσλειτουργίας (π.χ. κατά την αποστολή). Ωστόσο, αναδεικνύει ένα πολύ σοβαρό δυνητικό πρόβλημα, την ακεραιότητα ενός εγγράφου από τον συντάκτη μέχρι τον παραλήπτη του.

Το ευτύχημα, με το συγκεκριμένο φαινόμενο, όπως περιγράφεται, είναι ότι μπορεί εύκολα να αναπαραχθεί από κάθε ενδιαφερόμενο. Μάλιστα, αν συγκριθεί το συνημμένο που στάλθηκε με εκείνο που παραλήφθηκε, μπορεί να βγει συμπέρασμα αν η ζημιά έγινε στην πλευρά του αποστολέα, στο δρόμο ή στην πλευρά του παραλήπτη, επιτρέποντας αρκετά ενδελεχή έρευνα.

Οι Microsoft, κατασκευαστές λογισμικού που χειρίζονται έγγραφα με τους ιδιόκτητους τύπους της (xls, doc κ.τ.λ., π.χ. LibreOffice), τεχνικοί (όπως εγώ) κ.ά. θα έχουν τεράστιο ενδιαφέρον να το εξετάσουν. Πρόκειται για ένα έγγραφο που:

  • Χάλασε (τίποτα ιδιαίτερο ως εδώ)
  • Χάλασε τόσο λίγο, ώστε να μη γίνεται αντιληπτό από τα προγράμματα που το διαβάζουν (αναφέρονται πέντε στα πέντε, χωρίς να πρόκειται για εξαντλητική έρευνα)
  • Χάλασε αρκετά ώστε να χάνει ένα ικανό μέρος του περιεχομένου του, αναλόγως ποιο λογισμικό το διαβάζει: _ακριβώς_ μία παράγραφος εμφανίζεται ή όχι, καθιστώντας αδύνατο να φανταστεί, κανείς, ότι κάτι δεν πάει καλά (σπανιότατη βλάβη και… διαβολική σύμπτωση, για να μην ξεχνάμε και τον Μέρφι…)

Το ενδεχόμενο να πρόκειται για πρόβλημα που έχει ήδη ή μπορεί να ξανασυμβεί είναι πολύ σοβαρό, με συνέπειες δυνητικά πολύ χειρότερες από μια απλή παρεξήγηση (π.χ. θα μπορούσε να πρόκειται για μερικές παραγράφους σε ένα τεράστιο κείμενο που πάει για εκτύπωση).

Θεωρώ ότι μια τέτοια περίπτωση είναι το ανάλογο στη βιομηχανία λογισμικού μιας ανεξήγητης βλάβης σε αεροπλάνο. Ως τέτοια, χρήζει αναλόγως ενδελεχούς έρευνας. Καθώς, μάλιστα, πρόκειται για δημοσιευμένο κείμενο, μπορεί να διατεθεί χωρίς προβλήματα ιδιωτικότητας και, προσωπικά, με ενδιαφέρει πολύ δω τις διάφορες εκδοχές του (σωσμένο σύνταξης, συνημμένο αποστολής και παραλαβής, σωσμένο παραλαβής). Αν οι εμπλεκόμενοι μου τα διαθέσουν, θα επανέλθω.

Από τον τύπο εγγράφου .doc δεν θα περίμενα και πολλά, καθώς αντικαταστάθηκε από νεότερο ήδη από το 2007 (αλλά ουδέποτε εγκαταλήφθηκε…). Από μια γρήγορη έρευνα, όμως, ακόμα και οι πιο σύγχρονοι και πολυχρησιμοποιημένοι τύποι εγγράφων, όπως οι .docx και .xlsx, δεν έχουν ενσωματωμένους μηχανισμούς ελέγχου ακεραιότητας, παρότι είναι επιρρεπείς σε αλλιώσεις, ειδικά σε μεγάλα έγγραφα με πολλές αλλαγές, αναθεωρήσεις και αποθηκεύσεις! 

Μέχρι ένα ενδεχόμενο πόρισμα για την πιθανότητα με την οποία συμβαίνει μια τόσο αδιόρατη βλάβη και την ενσωμάτωση της αντίστασης στο πρόβλημα στους ίδιους τους τύπους εγγράφων, ιδιόκτητους και δημόσιους, εξασφαλίζουμε την ακεραιότητα των εγγράφων μας με οποιοδήποτε πρόσφορο ψηφιακή μηχανισμό checksum ή hashing (π.χ. SHA, MD5, χρονοσήμανση, υπογραφή, κρυπτογράφηση).


Το παρόν άρθρο πρωτοδημοσιεύτηκε στις 20/12/2020 στο ιστολόγιο «Επί Παντός» με τίτλο «Ο Δαίμων του Τυπογραφείου Μεταλλάχθηκε σε Ψηφιακό».