Περίληψη:
Εισαγωγή: Η ανάπτυξη της επιστήμης της πληροφορικής (Informatics), με ανακάλυψη τεχνικών και εργαλείων σε επίπεδο γλώσσας μηχανής, έχει συντελέσει στην περαιτέρω ανάπτυξη πολλών άλλων επιστημονικών κλάδων όπως είναι αυτοί της Ιατρικής, της Βιολογίας, της Βιομετρίας, της Στατιστικής κτλ (Sim et al, 2012; Wong, 2016). Σε αρκετές περιπτώσεις, η παράλληλη ανάπτυξη δύο διακριτών κλάδων οδήγησε στη δημιουργία νέων επιστημονικών περιοχών, όπως για παράδειγμα, η εφαρμογή της Πληροφορικής και της Στατιστικής σε Βιο-Ιατρικές επιστήμες οδήγησε στους διακριτούς αλλά άρρηκτα συνδεδεμένους επιστημονικούς κλάδους της Βιο-πληροφορικής (Bioinformatics) και της Βιο-στατιστικής (Biostatistics) (Moody, 2004; Indrayan, 2012.). Η Βιο-στατιστική και η Βιο-πληροφορική είναι σχετικά πρόσφατοι επιστημονικοί τομείς, όμως, είναι γοργά αναπτυσσόμενοι τα τελευταία χρόνια. Στις Βιο-ιατρικές επιστήμες γίνεται χρήση κλιμάκων/δεικτών που στόχο έχουν την ακριβή, έγκυρη και αξιόπιστη μέτρηση ενός κλινικού ή συμπεριφοριστικού χαρακτηριστικού ενός ατόμου (McDowell, 2006). Οι κλίμακες χρησιμοποιούνται σε διάφορους επιστημονικούς τομείς όπως είναι η εκπαίδευση, η οικονομία, η βιομετρία, η ψυχομετρία και η ιατρική και αποσκοπούν στη μέτρηση διαφόρων κλινικών χαρακτηριστικών, τα οποία πρακτικά είναι δύσκολο να μετρηθούν ποσοτικά (Kant, 1996; Streiner & Norman, 2008). Οι κλίμακες (Scales) είναι ποσοτικές τυχαίες μεταβλητές, συνεχείς ή διακριτές, που ακολουθούν γνωστή ή άγνωστη κατανομή, και στόχο έχουν να αποτιμούν βιοχημικά (π.χ. Επίπεδο Ορού Σακχάρου, Επίπεδο Χοληστερόλης, κτλ), κλινικά (π.χ. Αίσθηση Πόνου, Κατάθλιψη, κτλ) ή συμπεριφοριστικά χαρακτηριστικά (π.χ. Γενικό Διαιτητικό Πρότυπο, Βαθμός Υιοθέτησης Μεσογειακής Διατροφής, κτλ) των ατόμων ενός πληθυσμού (Beck, 1961; Huskisson 2012; Bach, 2006). Οι κλίμακες κατασκευάζονται από το μη σταθμισμένο ή σταθμισμένο αριθμητικό άθροισμα m μεταβλητών. Οι m μεταβλητές αντιπροσωπεύουν διαφορετικές πτυχές της κατάστασης ενός ατόμου (π.χ. εκπαιδευτικό επίπεδεο, οικονομική κατάσταση, πάθηση, υιοθέτηση διατροφικού προτύπου, κτλ) που στοχεύει να αποτιμήσει ο δείκτης με σκοπό τον ορθό και έγκυρο διαχωρισμό (classification) (Bansal & Pepe, 2013). Η μεθοδολογία κατασκευής των κλιμάκων δεν είναι μονοσήμαντα καθιερωμένη στη διεθνή βιβλιογραφία, καθώς δεν υπάρχει πλαίσιο που να περιλαμβάνει σαφείς οδηγίες για όλα τα στάδια κατασκευής τους, όπως π.χ. ο αριθμός των μεταβλητών που απαιτούνται ή τον τρόπο βαθμονόμησης αυτών (Panagiotakos, 2009).
Σκοπός: Σκοπός της παρούσας διδακτορικής διατριβής είναι η ποσοτική διερεύνηση, με χρήση θεωρητικής ή/και αναλυτικής αποδεικτικής διαδικασίας, της σχέσης μεταξύ της ακρίβειας των κλιμάκων και συγκεκριμένων δομικών χαρακτηριστικών, όπως είναι:
α) Ο αριθμός k των διαμερίσεων/διαιρέσεων των m διακριτών συνιστωσών μεταβλητών, στην περίπτωση μιας διακριτής κλίμακας (μια κλίμακα που δημιουργείται από διακριτές συνιστώσες μεταβλητές), (Bersimis F. et al, 2013).
β) Το εύρος l του στηρίγματος/πεδίου ορισμού των m συνεχών συνιστωσών μεταβλητών, στην περίπτωση μιας συνεχούς κλίμακας (μια κλίμακα που δημιουργείται από συνεχείς συνιστώσες μεταβλητές), (Bersimis F. et al, 2016).
γ) Η απόδοση σταθμίσεων wi στις συνιστώσες μεταβλητές μιας κλίμακας. Η τιμή της στάθμισης εκφράζει το βαθμό συσχέτισης ανάμεσα στις συνιστώσες μεταβλητές και το χαρακτηριστικό Y που η κλίμακα στοχεύει να αξιολογήσει (Bersimis F. et al, 2017).
δ) Ο αριθμός m των συνιστωσών μεταβλητών μιας κλίμακας (Bersimis F. et al, 2017).
Από τις προαναφερθείσες επιμέρους διερευνήσεις, ολιστικός σκοπός της διδακτορικής διατριβής αυτής είναι να σχηματιστεί ένα προτεινόμενο μεθοδολογικό υπόβαθρο για την κατασκευή κλιμάκων με υψηλή διαχωριστική/διακριτική ικανότητα και προβλεπτική ακρίβεια.
Υλικό-Μέθοδος: Στην παρούσα διατριβή χρησιμοποιούνται θεωρητικές αποδείξεις με χρήση στοιχείων άλγεβρας και ανάλυσης, καθώς επίσης και πλήθος σεναρίων με προσομοιωμένα δεδομένα. Πιο συγκεκριμένα, στην περίπτωση της διερεύνησης της ευαισθησίας ως προς τον αριθμό k των διαιρέσεων/διαμερίσεων των διακριτών συνιστωσών για μεταβλητές που ακολουθούν άγνωστη κατανομή ή την ομοιόμορφη, αποδεικνύονται θεωρητικά οι αντίστοιχες προτάσεις με χρήση στοιχείων άλγεβρας (Ακολουθίες και Σειρές). Θεωρητικές αποδείξεις χρησιμοποιούνται επίσης στην περίπτωση της διερεύνησης της ευαισθησίας ως προς το εύρος l του στηρίγματος των συνεχών συνιστωσών μεταβλητών, για ομοιόμορφα ή κανονικά κατανεμημένες μεταβλητές, με χρήση στοιχείων ανάλυσης (Ολοκληρωτικός Λογισμός). Στην περίπτωση της διερεύνησης της χρήσης σταθμίσεων σε κλίμακες, με χρήση προσομοίωσης (Monte Carlo) δημιουργήθηκε ένα σύνολο 1.000 αρχείων με διαφοροποίηση ως προς τις παραμέτρους των χρησιμοποιούμενων κατανομών, ως προς τον αριθμό m των συνιστωσών μεταβλητών, ως προς το μέγεθος n των δειγμάτων (π.χ. 100, 1.000, 10.000 κτλ), ως προς την αναλογία μεταξύ ατόμων με κάποιο χαρακτηριστικό και ατόμων που δεν διαθέτουν το χαρακτηριστικό (1:3, 1:4, κτλ) (Sheldon, 2006). Πιο συγκεκριμένα, έγινε χρήση της ομοιόμορφης και της κανονικής κατανομής με ποικιλία παραμετροποίησης για κάθε σενάριο. Επίσης γίνεται χρήση τροποποιημένων κατανομών ώστε να προσεγγίζουν τις εμπειρικές κατανομές από διάφορα χαρακτηριστικά του εκπαιδευτικού, του οικονομικού και του ιατρο-βιολογικού χώρου. Στα πλαίσια αυτής της διατριβής κατασκευάστηκαν εννέα κλίμακες Τi, i=0, 1,2,,…,8 με διαφορετική μεθοδολογία στάθμισης η κάθε μια. Για την κλίμακα Τ0 δεν χρησιμοποιήθηκε στάθμιση, οπότε παράγεται από το απλό αλγεβρικό άθροισμα των μεταβλητών Χj, j=1,2,..,m, κατόπιν τυποποίησης τους. Οι σταθμίσεις προέκυψαν από την εφαρμογή της λογιστικής παλινδρόμησης και της διαχωριστικής ανάλυσης με εξαρτημένη μεταβλητή την Υ που εκφράζει την κατάσταση ενός ατόμου και ανεξάρτητες τις επεξηγηματικές συνιστώσες μεταβλητές Χj, j=1, 2,..,m.. Η διαγνωστική ακρίβεια της εκάστοτε κλίμακας, αξιολογείται υπολογίζοντας το εμβαδόν (AUC) της επιφάνειας κάτω από την (ROC) καμπύλη λειτουργικών χαρακτηριστικών, την ευαισθησία (Sensitivity - True Positive Ratio), την ειδικότητα τους (Specificity - True Negative Ratio), την ακρίβεια (Accuracy - True Ratio), την θετική και αρνητική προγνωστική αξία (Positive/Negative Predictive Value). Με χρήση προσομοίωσης αξιολογείται επίσης η προβλεπτική τους ικανότητα και οι σταθμισμένες κλίμακες αξιολογούνται στην περίπτωση πραγματικών διαιτολογικών δεδομένων, από τη μελέτη ATTICA, και δημιουργούνται χρησιμοποιώντας 5 συνιστώσες, οι οποίες επιλέγονται τυχαία από το γενικό πρότυπο της Μεσογειακής διατροφής.
Αποτελέσματα: Η θεωρητική απόδειξη, τόσο στην περίπτωση των διακριτών κλιμάκων, όσο και στην περίπτωση των συνεχών κλιμάκων, παρουσιάζει ότι η διαγνωστική ακρίβεια μιας κλίμακας, μετρούμενη μέσω της συνάρτησης ευαισθησίας, βελτιώνεται όταν ο αριθμός k των διαμερίσεων (διαιρέσεων) των διακριτών μεταβλητών αυξάνει ή όταν το εύρος l του στηρίγματος (πεδίου ορισμού) των συνεχών μεταβλητών γίνεται πιο ευρύ. Ο βαθμός συσχέτισης των συνιστωσών μεταβλητών με την εξαρτημένη βρέθηκε να επηρεάζει τη διαγνωστική ακρίβεια μιας κλίμακας. Πιο συγκεκριμένα, χρησιμοποιήθηκαν αρχικά σετ προσομοιωμένων δεδομένων από συσχετισμένες μεταβλητές με διαφορετικό συντελεστή συσχέτισης με την εξαρτημένη μεταβλητή. Η διαγνωστική ακρίβεια των σταθμισμένων κλιμάκων είναι υψηλότερη σε σχέση με αυτή της μη-σταθμισμένης κλίμακας. Η διαγνωστική ακρίβεια της κλίμακας βελτιώνεται επίσης στην περίπτωση που ο αριθμός m των συνιστωσών μεταβλητών αυξάνεται. Τα παραπάνω αποτελέσματα εφαρμόστηκαν και επαληθεύτηκαν σε κλίμακα που εκφράζει διατροφολογικό δείκτη, βασιζόμενο σε συνιστώσες μεταβλητές του MedDietScore, σε δείγμα 981 ανδρών και γυναικών, αναφορικά με τους παράγοντες καρδιαγγειακού κινδύνου (δηλαδή, παχυσαρκία, σακχαρώδη διαβήτη, υπέρταση, υπερχοληστερολαιμία), μετά από έλεγχο για πιθανούς συγχυτικούς παράγοντες.
Συμπεράσματα: Οι κλίμακες χρησιμοποιούνται ευρέως σε διαφόρους επιστημονικούς κλάδους, ειδικότερα στο χώρο της εκπαίδευσης, της οικονομίας και της υγείας, για την ανίχνευση χαρακτηριστικών ή στάσεων που είναι δύσκολο να ανιχνευθούν (Kant, 1996). Η ακριβής μέτρηση κάποιου χαρακτηριστικού, με τη χρήση μιας σύνθετης κλίμακας στο χώρο της υγείας, προσφέρει τη δυνατότητα έγκαιρης και ορθής διάγνωσης μιας νόσου, με συνέπεια την καταλληλότερη θεραπεία του ατόμου που νοσεί και κατ' επέκταση τη βελτίωση της ποιότητας της ζωής του. Σε αυτή τη διδακτορική διατριβή, προτείνονται μέθοδοι για τη βελτίωση της ακρίβειας κλιμάκων σχετικών με την υγεία που παρέχουν ωφελιμότητα σε επίπεδο δημόσιας υγείας με άμεσα αποτελέσματα τη χρήση λιγότερων κρατικών πόρων για τη θεραπεία των ασθενών ατόμων ενός πληθυσμού. Μια κλίμακα παρουσιάζει υψηλή διαχωριστική ικανότητα όταν ικανοποιούνται οι ακόλουθες συνθήκες:
α) Ο αριθμός k των διαμερίσεων/διαιρέσεων των m διακριτών συνιστωσών μεταβλητών λαμβάνει τη μέγιστη δυνατή τιμή, χωρίς να εμφανίζεται το πρόβλημα της δυασταξινόμησης των ατόμων ενός πληθυσμού, στην περίπτωση μιας διακριτής σύνθετης κλίμακας (Bersimis F. et al, 2013).
β) Το εύρος l του στηρίγματος/πεδίου ορισμού των m συνεχών συνιστωσών μεταβλητών γίνεται ευρύ, στην περίπτωση μιας συνεχούς σύνθετης κλίμακας, χωρίς να εμφανίζεται το πρόβλημα της δυσταξινόμησης των ατόμων ενός πληθυσμού (Bersimis F. et al, 2016).
γ) Η στάθμιση wi στις συνιστώσες μεταβλητές μιας σύνθετης κλίμακας να προέρχεται από στατιστική μέθοδο ταξινόμησης, όπως είναι η Λογιστική Παλινδρόμηση ή η Διαχωριστική Ανάλυση (Bersimis F. et al, 2017).
δ) Ο αριθμός m των συνιστωσών μεταβλητών μιας σύνθετης κλίμακας που σχετίζονται με το χαρακτηριστικό που αποτιμά η κλίμακα να είναι ο μέγιστος, δηλαδή να γίνεται χρήση όλων των συνιστωσών μεταβλητών που σχετίζονται με το αποτέλεσμα της υγείας (Bersimis F. et al, 2017).