Νέα υποσελίδα: Βιβλιοθήκη
- peloponnisios
- More than 150 posts user.
- Δημοσιεύσεις: 159
- Εγγραφή: 14 Αύγ 2012 03:38 am
Re: Νέα υποσελίδα: Βιβλιοθήκη
- socrates
- More than 150 posts user.
- Δημοσιεύσεις: 438
- Εγγραφή: 21 Οκτ 2006 11:31 pm
- Τοποθεσία: the other side of nowhere
Re: Νέα υποσελίδα: Βιβλιοθήκη
Προσπαθώ να καταλάβω κάποιες λεπτότερες διαφορές στους τρόπους αναζητήσεως-μερικές παρατηρήσεις για όταν έχεις καιρό να μου πείς αν συμφωνείς:
1 Άφησα το OCR στα γαλλικά επίτηδες, γιατί πρόσεξα ένα τραγούδι με τίτλο "Parlez moi d' Amour", με σκοπό να το αναζητήσω. Ξαναέκανα το OCR ελληνικά και αντέγραψα τον τίτλο όπως είναι στο έγγραφο και τον επικόλλησα στην αναζήτηση όπου εμφανίζεται σαν (Parlez Π1Οi d'AΠ1our). Δεν καταλαβαίνω την αλλαγή στις λέξεις "moi" και "Amour" αλλά έλαβα μήνυμα από το adobe ότι ένα internal error συνέβη στην αντιγραφή, ωστόσο η αναζήτηση (Parlez Π1Οi d'AΠ1our) βρίσκει τον τίτλο, αλλά αν επικολλήσω το σωστό τίτλο "Parlez moi d' Amour" δεν τον βρίσκει. Ξανα-άλλαξα το OCR στα αγγλικά και με "Parlez moi d' Amour" η αναζήτηση δεν βρίσκει τίποτα, αλλά αν σβήσω τις άλλες λέξεις και αφήσω μόνο "Parlez" τότε βρίσκει το τραγούδι και στις δύο περιπτώσεις όπου ο τίτλος είναι παρών. Αλλά εδώ αν αναζητήσω με (Parlez Π1Οi d'AΠ1our) δεν βρίσκει τίποτα, και μου φαίνεται λογικό αυτό γιατί το OCR είναι τώρα στα αγγλικά. (?)
2 Άνοιξα ένα pdf που μου φαίνεται κάπως πιο δύσκολο για ανάγνωση/οπτική αναγνώριση-το ανεβάζω συνημμένο. Είναι ένα 4σέλιδο έγγραφο που δίνει σε unicode όλα τα αρχαία ελληνικά μουσικά σύμβολα. Εδώ δεν μου δίνει επιλογές να αλλάξω το OCR του συγκεκριμένου αρχείου-η ευκολία εμφανίζεται απενεργοποιημένη. Πήγα στη δεύτερη σελίδα του εγγράφου και αντέγραψα το δεύτερο σύμβολο της πέμπτης σειράς που μοιάζει σαν ένα κεφαλαίο "Γ" αλλά σε mirror form (βλέπει προς τα πίσω). Όταν το τοποθετώ στην αναζήτηση δεν εμφανίζεται το σύμβολο αυτό καθαυτό αλλά το τετραγωνίδιο που το περιέχει, αλλά κάνω αναζήτηση και με πηγαίνει στο συγκεκριμένο σύμβολο. Κάνω το ίδιο με διάφορα σύμβολα, αντιγράφω και επικολλώ στην αναζήτηση, πάντα εμφανίζεται ένα πανομοιότυπο ορθογώνιο σχήμα, ποτέ το unicode σύμβολο, αλλά η αναζήτηση με πάει πάντα στο συγκεκριμένο σύμβολο που αντέγραψα, όπου υπάρχει στο έγγραφό μου και όχι σε άλλα σύμβολα. Δεν είμαι σίγουρος για το τι να συμπεράνω απ' αυτό. Το acrobat παρ' όλο που δεν εμφανίζει το σύμβολο όταν το επικολλώ, ωστόσο το αναγνωρίζει σαν συγκεκριμένο και το διαφοροποιεί από τα υπόλοιπα, και έτσι με πάει στις περιπτώσεις όπου αυτό υπάρχει μες το έγγραφο. (?)
Στην παρούσα περίπτωση μου φαίνεται πως αυτό το έγγραφο unicode έχει μουσικολογική πρακτική αξία αν θα μπορούσε να τροποποιηθεί/βελτιωθεί για τη χρήση
πρακτικών μουσικών. Εννοώ αν θα μπορούσαμε κατά κάποιο τρόπο να συνδυάσουμε όλα τα σύμβολα με τα αντίστοιχα της σύγχρονης μουσικής γραφής τους στο πεντάγραμμο και να τα ενώσουμε σε ένα PDF. Μπορεί να το ψάξω στο μέλλον αυτό.
3 Υποπτεύομαι πως η διαδικασία που περιέγραψα συμβαίνει και με άλλα Unicode έγγραφα που περιέχουν άλλα σύμβολα, ζωδιακά σύμβολα, κυριλλικό αλφάβητο, κ.λπ. Αξίζει κάποια έρευνα και εδώ για μετατροπή τους σε επεξεργάσιμους οπτικούς χαρακτήρες.
4 Τελικά, για τα δικά μας έγραφα αυτής της ενότητας, σκέφτομαι χοντρικά πως δεν χρειάζονται παρά μόνο δύο σετ χαρακτήρων, το ελληνικό και το λατινικό αλφάβητο (οποιασδήποτε ινδοευρωπαϊκής γλώσσας). Τί νομίζεις?
- peloponnisios
- More than 150 posts user.
- Δημοσιεύσεις: 159
- Εγγραφή: 14 Αύγ 2012 03:38 am
Re: Νέα υποσελίδα: Βιβλιοθήκη
Δεν πειράζει, Σωκράτη. Δεν έγινε τίποτα, σιγά το παίδεμα.
Το OCR δεν χρειάζεται να το πειράζεις, αυτό προσπαθώ να εξηγήσω. Γιατί αυτό που κάνεις, αν καταλαβαίνω καλά, είναι να λες στο πρόγραμμα να πραγματοποιήσει οπτική αναγνώριση χαρακτήρων ενώ έχει ήδη γίνει από μένα πριν το ανεβάσουμε. Εσύ αν θες να ψάξεις έναν όρο, απλώς αναζητάς με Edit/Find τίποτε άλλο. Αν όμως έψαχνες σε ένα άλλο pdf και δεν σου έβρισκε τίποτα, τότε θα μπορούσες να κάνεις το OCR γιατί θα σήμαινε ότι δεν έχει ήδη γίνει. Και μετά θα μπορούσες να κάνεις την αντίστοιχη αναζήτηση. Αυτό π.χ. μπορείς να το κάνεις για τα Ελληνικά στα συμπληρώματα Victor. Αφού έχεις το Acrobat Pro με το οποίο γίνεται μια χαρά αυτή δουλειά, κάνε ένα OCR για τα Ελληνικά εφόσον σου χρειάζεται κι έτσι θα μπορείς να βρίσκεις ελληνικούς όρους σε αυτά το pdf. Καταλαβαίνω αυτό που λες με τα σύμβολα και τα κουτάκια, αλλά γιατί θες να παιδεύεσαι; Δεν χρειάζεται να αλλάξεις κάτι στο pdf ούτε να αναζητάς με ακατανόητα σύμβολα. Για το Parlez moi, η αναζήτηση βρίσκει αποτέλεσμα γιατί όπως είπα στο προηγούμενο μήνυμα, το πρόγραμμα κοιτάει να βρει λατινικούς χαρακτήρες που χρησιμοποιεί η αγγλική γλώσσα. Δεν διαβάζει λέξεις. Έτσι θα σου βρει οτιδήποτε έχει π.χ. τα σύμφωνα p,r,l,z,m και τα φωνήεντα a,e,o,i γιατί είναι χαρακτήρες της αγγλικής γλώσσας (αλλά και της γαλλικής). Αν εσύ τώρα έκανες αναζήτηση για è, é, ê, πιθανότατα να μην σου επέστρεφε αποτελέσματα αφού δεν είναι χαρακτήρες που συναντώνται στην Αγγλική.socrates έγραψε: ↑15 Μάιος 2020 06:11 am1 Άφησα το OCR στα γαλλικά επίτηδες, γιατί πρόσεξα ένα τραγούδι με τίτλο "Parlez moi d' Amour", με σκοπό να το αναζητήσω. Ξαναέκανα το OCR ελληνικά και αντέγραψα τον τίτλο όπως είναι στο έγγραφο και τον επικόλλησα στην αναζήτηση όπου εμφανίζεται σαν (Parlez Π1Οi d'AΠ1our). Δεν καταλαβαίνω την αλλαγή στις λέξεις "moi" και "Amour" αλλά έλαβα μήνυμα από το adobe ότι ένα internal error συνέβη στην αντιγραφή, ωστόσο η αναζήτηση (Parlez Π1Οi d'AΠ1our) βρίσκει τον τίτλο, αλλά αν επικολλήσω το σωστό τίτλο "Parlez moi d' Amour" δεν τον βρίσκει. Ξανα-άλλαξα το OCR στα αγγλικά και με "Parlez moi d' Amour" η αναζήτηση δεν βρίσκει τίποτα, αλλά αν σβήσω τις άλλες λέξεις και αφήσω μόνο "Parlez" τότε βρίσκει το τραγούδι και στις δύο περιπτώσεις όπου ο τίτλος είναι παρών. Αλλά εδώ αν αναζητήσω με (Parlez Π1Οi d'AΠ1our) δεν βρίσκει τίποτα, και μου φαίνεται λογικό αυτό γιατί το OCR είναι τώρα στα αγγλικά. (?)
Κατάλαβα τι γίνεται αλλά πολύ τα μπερδεύεις. Νομίζω πως δεν είναι χρήσιμα σε κάτι όλα αυτά. Και αυτό το τελευταίο με τα σύμβολα της μουσικής γραφής δεν μπορώ να βρω τι ιδιαίτερη εφαρμογή θα μπορούσε να έχει για να μας ωφελήσει. Να ψάξουμε δηλαδή για συγκεκριμένα σύμβολα σε παλιές χειρόγραφες παρτιτούρες; Γιατί; Άσε που δεν θα γινόταν αυτό γιατί το χειρόγραφο σύμβολο πιθανότατα δεν θα το έπιανε η αναζήτηση (ή θα το έβρισκε μια στο τόσο, άρα δεν θα είχε συνέπεια). Ή μήπως έχεις κάτι άλλο κατά νου;socrates έγραψε: ↑15 Μάιος 2020 06:11 am2 Άνοιξα ένα pdf που μου φαίνεται κάπως πιο δύσκολο για ανάγνωση/οπτική αναγνώριση-το ανεβάζω συνημμένο. Είναι ένα 4σέλιδο έγγραφο που δίνει σε unicode όλα τα αρχαία ελληνικά μουσικά σύμβολα. Εδώ δεν μου δίνει επιλογές να αλλάξω το OCR του συγκεκριμένου αρχείου-η ευκολία εμφανίζεται απενεργοποιημένη. Πήγα στη δεύτερη σελίδα του εγγράφου και αντέγραψα το δεύτερο σύμβολο της πέμπτης σειράς που μοιάζει σαν ένα κεφαλαίο "Γ" αλλά σε mirror form (βλέπει προς τα πίσω). Όταν το τοποθετώ στην αναζήτηση δεν εμφανίζεται το σύμβολο αυτό καθαυτό αλλά το τετραγωνίδιο που το περιέχει, αλλά κάνω αναζήτηση και με πηγαίνει στο συγκεκριμένο σύμβολο. Κάνω το ίδιο με διάφορα σύμβολα, αντιγράφω και επικολλώ στην αναζήτηση, πάντα εμφανίζεται ένα πανομοιότυπο ορθογώνιο σχήμα, ποτέ το unicode σύμβολο, αλλά η αναζήτηση με πάει πάντα στο συγκεκριμένο σύμβολο που αντέγραψα, όπου υπάρχει στο έγγραφό μου και όχι σε άλλα σύμβολα. Δεν είμαι σίγουρος για το τι να συμπεράνω απ' αυτό. Το acrobat παρ' όλο που δεν εμφανίζει το σύμβολο όταν το επικολλώ, ωστόσο το αναγνωρίζει σαν συγκεκριμένο και το διαφοροποιεί από τα υπόλοιπα, και έτσι με πάει στις περιπτώσεις όπου αυτό υπάρχει μες το έγγραφο. (?)
Στην παρούσα περίπτωση μου φαίνεται πως αυτό το έγγραφο unicode έχει μουσικολογική πρακτική αξία αν θα μπορούσε να τροποποιηθεί/βελτιωθεί για τη χρήση
πρακτικών μουσικών. Εννοώ αν θα μπορούσαμε κατά κάποιο τρόπο να συνδυάσουμε όλα τα σύμβολα με τα αντίστοιχα της σύγχρονης μουσικής γραφής τους στο πεντάγραμμο και να τα ενώσουμε σε ένα PDF. Μπορεί να το ψάξω στο μέλλον αυτό.
Για σχετικά με το ρεμπέτικο ντοκουμέντα που τυχαίνει να έχω και θα ανεβάσω σιγά σιγά έχω δει ότι μας χρειάζονται Ελληνικά (πολυτονικό ή/και μονοτονικό), Αγγλικά, Γαλλικά και πιθανώς Γερμανικά σε κάποια λίγα. Αλλά ανάλογα με το ντοκουμέντο ρυθμίζεται και το OCR, δεν είναι κάτι δύσκολο ούτε χρειάζεται ιδιαίτερη προετοιμασία.
- peloponnisios
- More than 150 posts user.
- Δημοσιεύσεις: 159
- Εγγραφή: 14 Αύγ 2012 03:38 am
Re: Νέα υποσελίδα: Βιβλιοθήκη
Επίσης, αν έχεις κάποια συγκεκριμένη υλοποίηση που θες να προτείνεις ή να προετοιμάσεις σχετικά με τη Βιβλιοθήκη, πες μας ή δείξε μας και αν είναι χρήσιμο το ενσωματώνουμε. Το λέω αυτό γιατί με την προηγούμενη δημοσίευση κάπου έχασα το νήμα και δεν είμαι σίγουρος αν με το παραπάνω σκέφτεσαι κάτι πολύ συγκεκριμένο που θα μας βοηθήσει ή αν εκθέτεις γενικά ιδέες με αφορμή τα searchable pdf...
Re: Νέα υποσελίδα: Βιβλιοθήκη
Εδώ το νέο θέμα με τίτλο "Σύμβολα αρχαίας Ελληνικής μουσικής"
viewtopic.php?f=68&t=5505&p=34169#p34169
- peloponnisios
- More than 150 posts user.
- Δημοσιεύσεις: 159
- Εγγραφή: 14 Αύγ 2012 03:38 am
Re: Νέα υποσελίδα: Βιβλιοθήκη
Και τα δύο έγγραφα είχαν συνταχτεί στα Γαλλικά. Στα pdf έχουμε ενσωματώσει ελληνική μετάφραση που ακολουθεί με ακρίβεια το πρωτότυπο κείμενο.
Τα τεκμήρια προέρχονται από το Αρχείο του Charles Howard. Στη μετάφραση από τα Γαλλικά στα Ελληνικά συνέβαλαν ο Μπάμπης Παπαδημητρίου και η Φωτεινή Βασιλοπούλου. Θερμές ευχαριστίες και στους τρεις!