Εισαγωγή δεδομένων

Σε αυτό το σημείο του βιβλίου, θα μάθετε πώς να εισάγετε διαφορετικούς τύπους δεδομένων στην R, καθώς και πώς να τα μετατρέψετε σε μία μορφή χρήσιμη για ανάλυση. Μερικές φορές χρειάζεται απλά η κλήση μιας συνάρτησης από το κατάλληλο πακέτο εισαγωγής δεδομένων. Σε πιο περίπλοκες περιπτώσεις όμως, μπορεί να χρειαστεί τόσο η τακτοποίηση όσο και ο μετασχηματισμός, για να καταλήξετε στη τακτοποιημένη μορφή πίνακα με την οποία θα προτιμούσατε να εργαστείτε.

Το μοντέλο επιστήμης δεδομένων μας με την εισαγωγή επισημασμένη με μπλε χρώμα.
Σχήμα 1: Η εισαγωγή δεδομένων είναι η αρχή της διαδικασίας της επιστήμης των δεδομένων. Χωρίς δεδομένα δεν μπορείτε να εφαρμόσετε την επιστήμη των δεδομένων!

Σε αυτό το σημείο του βιβλίου θα μάθετε πώς να αποκτήσετε πρόσβαση σε δεδομένα που είναι αποθηκευμένα με τους ακόλουθους τρόπους:

Υπάρχουν δύο σημαντικά πακέτα του tidyverse που δεν συζητάμε εδώ: το haven και το xml2. Εάν εργάζεστε με δεδομένα από αρχεία SPSS, Stata και SAS, ρίξτε μία ματιά στο πακέτο haven, https://haven.tidyverse.org. Εάν εργάζεστε με δεδομένα XML, ρίξτε μία ματιά στο πακέτο xml2, https://xml2.r-lib.org. Διαφορετικά, θα χρειαστεί να κάνετε λίγη έρευνα για να καταλάβετε ποιο πακέτο θα χρειαστεί να χρησιμοποιήσετε κάθε φορά. Το Google, σε αυτή την περίπτωση, είναι φίλος σας 😃.