Περί ψηφιοποίησης ο λόγος

Παίρνω αφορμή από ένα ιστο-άρθρο του Νίκου Σαραντάκου για το φλασάκι της Άννας Διαμαντοπούλου που θα χωράει, λέει, όλα τα βιβλία της Εθνικής Βιβλιοθήκης για να γράψω και εγώ κάτι σχετικά με τις ψηφιοποιήσεις κειμενικού υλικού που τα τελευταία χρόνια είναι πολύ της μόδας.

Από το 1999 που ασχολούμαι με τη (φιλολογική και γλωσσολογική) έρευνα χρησιμοποιώ κειμενικό υλικό σε ψηφιακή μορφή. Έχω φτιάξει ηλεκτρονικά σώματα κειμένων (που δυστυχώς έχουν μείνει αδημοσίευτα για διάφορους λόγους) και βάσεις δεδομένων και έχω ψηφιοποιήσει για χρήση από ερευνητικές ομάδες κειμενικό υλικό σε μορφή εικόνας. Κάποια πράγματα σχετικά τα έχω δημοσιεύσει εδώ, εδώ, εδώ και εδώ· εδώ παρουσίασα το έργο άλλων σχετικά με τις ψηφιακές εκδόσεις. Μπορεί ότι έχω κάνει μέχρι τώρα να είναι λειψό και να έχει μείνει στη μέση, δικαιούμαι όμως να ομιλώ και ως ερευνητής και ως digital humanist (αν έχεις καλή μετάφραση για τον όρο, άφησε σε παρακαλώ σχόλιο).

Ο Νίκος συζητά στο ιστο-άρθρο του την ψηφιοποίηση των βιβλίων των δημόσιων βιβλιοθηκών, ένα θέμα με το οποίο ασχολήθηκα προχείρως εδώ (κυρίως γιατί επιτέλους ψηφιοποιήθηκαν τα «Μεσαιωνικά και Νέα Ελληνικά» του Γ. Χατζιδάκη και μάλιστα περισσότερο από μία φορές). Την ιστορία και το λινκ τα ξεσήκωσα από το ιστολόγιο elektronikosanagnostis.blogspot.com.

Γράφει λοιπόν ο Νίκος

Τι εννοώ; Εννοώ ότι η επιλογή των βιβλίων που ψηφιοποιήθηκαν έγινε, όπως φαίνεται, εντελώς απροσχεδίαστα. Υποψιάζομαι, και διαψεύστε με, ότι ο υπεύθυνος κάθε δημόσιας βιβλιοθήκης διάλεξε εκείνος τα βιβλία που θα έδινε για ψηφιοποίηση, ενδεχομένως διαλέγοντας τα καλύτερα αποκτήματα της βιβλιοθήκης του, με βάση κάποιες γενικές οδηγίες άνωθεν. Αυτό όμως είχε συνέπεια κάποια βιβλία που θεωρούνται “καλά” να ψηφιοποιηθούν δυο και τρεις και παραπάνω φορές, από διάφορες βιβλιοθήκες! Για παράδειγμα, τα “Μεσαιωνικά και νέα ελληνικά” του Γ. Χατζιδάκι έχουν ψηφιοποιηθεί τρεις φορές ο κάθε τόμος (είναι δίτομο το έργο). Πολλοί τόμοι από το Ημερολόγιον Σκόκου (έβγαινε κάθε χρόνο, από το 1885 ως το 1918) έχει ψηφιοποιηθεί δυο και τρεις φορές (ο τόμος του 1915 έχει το ρεκόρ: τέσσερις φορές!). Το πιο κωμικό (ή τραγικό) είναι ότι κανένας τόμος του Ημερολογίου Σκόκου δεν έπρεπε να ψηφιοποιηθεί, εκτός αν έχουμε λεφτά για πέταμα, διότι ολόκληρο το Ημερολόγιο Σκόκου έχει ήδη ψηφιοποιηθεί, με πολύ καλύτερο τρόπο, με ευρετήρια, δυνατότητα αναζήτησης και (σχεδόν) όλα τα καλούδια, στο πλαίσιο του προγράμματος “Κοσμόπολις” -για παράδειγμα, εδώ βλέπετε τον τόμο του 1918 από την Κοσμόπολη. Όταν έχει ήδη ψηφιοποιηθεί επαρκέστατα το υλικό, γιατί να πληρώνουμε λεφτά για να ξανα-ψηφιοποιείται με πολύ χειρότερο τρόπο (χωρίς ευρετήρια, χωρίς αναζήτηση, χωρίς ευκολία χρήσης); Και άλλα περιοδικά που έχουν ήδη ψηφιοποιηθεί με το πρόγραμμα “Κοσμόπολις” ή με το “Πλειάς” ξαναψηφιοποιήθηκαν άδικα στο νέο πρόγραμμα, όπως π.χ. η Ποικίλη Στοά ή ο Ρωμηός.

Όλα τα σφάζω, όλα τα μαχαιρώνω με άλλα λόγια δηλαδή. Η ψηφιοποίηση για να έχει νόημα πρέπει να γίνεται σωστά και μετρημένα· όταν γίνεται έτσι κοστίζει και απαιτεί συνεργασία τεχνολόγων και ειδικών επί του υλικού που ψηφιοποιείται, στην παρούσα περίπτωση βιβλιοθηκονόμων. Τα σχόλια των αναγνωστών στο ιστο-άρθρο του Νίκου περιγράφουν την κατάσταση της παρούσας λύσης η οποία μάλιστα παραμένει στον ιστότοπο ypepth.gr και δεν μετακόμισε μαζί με το υπόλοιπο υπουργείο στο minedu.gov.gr (5,5 εκατομύρια ευρώ που κόστισε η ιστορία δεν φτάνουν για μετακόμιση σε άλλο server ή για ξεχωριστό ιστότοπο, περισσότερο αναγνωρίσιμο, προφανώς). Ας είναι.

Αυτό που μου έκανε εντύπωση είναι ότι το Εθνικό Κέντρο Τεκμηρίωσης πήρε το ίδιο ψηφιοποιημένο υλικό δύο βιβλιοθηκών (των Σερρών και της Λειβαδιάς) και έφτιαξε μια καθόλα αξιοπρεπή και χιλιάδες φορές καλύτερη εφαρμογή για πρόσβαση στα ψηφιακά βιβλία (εδώ και εδώ αντίστοιχα). Όταν διαβάζει κανείς το τεκμήριο που τον ενδιαφέρει online, βλέπει στο κάτω μέρος της οθόνης, αρκετά διακριτικά γραμμένο είναι η αλήθεια, το ακόλουθο disclaimer:

Το ψηφιοποιημένο υλικό του αποθετηρίου έχει παραχθεί στο πλαίσιο του έργου “Ψηφιοποίηση Υλικού Δημοσίων Βιβλιοθηκών” του ΕΠ Κοινωνία της Πληροφορίας (Γ’ ΚΠΣ).
Για την ποιότητα της ψηφιοποίησης δεν ευθύνονται η Δημόσια Κεντρική Βιβλιοθήκη Σερρών και το Εθνικό Κέντρο Τεκμηρίωσης.

Προφανώς ευθύνεται ο Φούφουτος, που τσέπωσε και τα εκατομύρια που λέγαμε πιο πάνω.

Η τάση να επιδιώκεται ψηφιοποίηση υλικού που είναι ήδη ψηφιοποιημένο δεν είναι βέβαια καινούργια. Ένα άλλο παράδειγμα είναι ο «Θησαυρός της Ελληνικής Γλώσσης»· δεν εννοώ τον TLG, φυσικά, αλλά το ελληνικό ξαδελφάκι του που μέχρι μερικούς μηνές μπορούσε κανείς να το βρει στη διεύθυνση www.thesavros.gr· στο μεταξύ η ιστοσελίδα βρίσκεται σε κώμα. Ιδού από το Internet Archive και την Wayback Machine μια αποθηκευμένη μορφή του ιστοτόπου με ημερομηνία 4 Φεβρουαρίου 2009.

Για τον «Θησαυρό της Ελληνικής Γλώσσας» πρωτοάκουσα στο Α´ Ευρωπαϊκό Συνέδριο Νεοελληνικών Σπουδών που έγινε στο Βερολίνο τον Οκτώβριο του 1998. Ορίστε η ανακοίνωση του Αθανάσιου Χ. Αναγνωστόπουλου από τα πρακτικά του συνεδρίου (ζητώ συγγνώμη για την ποιότητα, θα την διορθώσω προσεχώς):

Θησαυρός Ελληνικής Γλώσσης, Πρακτικά Α´ Ευρωπαϊκού Συνεδρίου Νεοελληνικών Σπουδών

Δεν θα σχολιάσω περισσότερο εγώ τα όσα περιγράφονται στην ανακοίνωση αυτή· η κωματώδης κατάσταση της ιστοσελίδας του ιδρύματος τα λέει όλα. Στο συνέδριο ήμουν παρών και ρώτησα γιατί ψηφιοποιούνται έργα που ήδη περιλαμβάνονται στον TLG αντί το βάρος να πέσει σε έργα της νεοελληνικής λογοτεχνίας που την εποχή εκείνη δεν υπήρχαν σε ψηφιακή μορφή. Η απάντηση που έλαβα ήταν στο πλαίσιο «Ψηφιοποίηση για Έλληνες από Έλληνες». Αν σου κίνησα την περιέργεια και σε ενδιαφέρει το παρασκήνιο πίσω από το ίδρυμα, κοίταξε εδώ. Και δες εδώ μια ιστοσελίδα από τα καλά χρόνια του ιδρύματος, πίσω στο 1999.

Δεν γνωρίζω αν υπάρχει το ίδρυμα και αν εξακολουθεί να ασκεί το πολύτιμό του έργο. Αν περνάς έξω απο την οδό Θρασύλλου στην Πλάκα ρίξε μια ματιά στο νούμερο 18 για το αν υπάρχει το ίδρυμα. Το σίγουρο είναι ότι η επένδυση που έγινε τη στιγμή που γράφω τις γραμμές αυτές πάει χαμένη, αφού η ιστοσελίδα του ιδρύματος είναι ανενεργή. Ελπίζω σύντομα να είναι πάλι κοντά μας…

Προσθήκη 18/09/2011: Διαβάζω εδώ πως το κτίριο στο οποίο στεγαζόταν το ίδρυμα, ιδιοκτησίας Υπουργείου Πολιτισμού, δεν είναι πια διαθέσιμο. Προφανώς έχει διακοπεί η χρηματοδότηση, τουλάχιστον από τους πόρους του Υπουργείου Πολιτισμού. Στο παρελθόν ο ίδιος βουλευτής πάντως ρωτούσε πιο σκληρές ερωτήσεις για το ίδιο ίδρυμα

Προσθήκη 20/10/2011: Ορίστε και το φυλλάδιο που είχε μοιραστεί στο συνέδριο του Βερολίνου με πληροφορίες για το ίδρυμα.

Θησαυρός Ελληνικής Γλώσσης Φυλλάδιο Βερολίνο 1999

Leave a reply

Your email adress will not be published. Required fields are marked*

Αυτός ο ιστότοπος χρησιμοποιεί το Akismet για να μειώσει τα ανεπιθύμητα σχόλια. Μάθετε πώς υφίστανται επεξεργασία τα δεδομένα των σχολίων σας.