Cyborg
Cyborg #24 - 06/2022

#24 - 06/2022

Το σώμα ως datacenter: αποθήκευση και επεξεργασία δεδομένων στο DNA
[ β' μέρος ]

Διαβάστε το πρώτο μέρος

Μπορούμε να κωδικοποιήσουμε ιατρικά αρχεία στο DNA μας;

Το 1878, μια σειρά από φωτογραφίες ενός αναβάτη στο άλογό του που καλπάζει μετατράπηκε στην πρώτη κινηματογραφική ταινία με τίτλο «The Galloping Horse». Πρόσφατα, ερευνητές στο Πανεπιστήμιο του Χάρβαρντ μπόρεσαν να αναδημιουργήσουν αυτήν την κλασική κινούμενη εικόνα στο DNA του βακτηρίου E. coli. Σωστά. Κωδικοποίησαν μια ταινία σε βακτήρια.

Εικόνες και άλλες πληροφορίες έχουν ήδη κωδικοποιηθεί σε βακτήρια εδώ και χρόνια. Ωστόσο, οι ερευνητές του Χάρβαρντ έκαναν ένα βήμα παραπέρα με το εργαλείο επεξεργασίας γονιδίων CRISPR-Cas. Αυτή η διαδικασία επιτρέπει στα κύτταρα να συλλέγουν πληροφορίες κωδικοποιημένες από το DNA, με χρονολογική σειρά, ώστε να μπορούν να δημιουργήσουν μια μνήμη ή μια εικόνα, όπως ακριβώς κάνει μια κινηματογραφική κάμερα. […] Το έργο τους αλλάζει τον τρόπο με τον οποίο μπορούν να μελετηθούν πολύπλοκα συστήματα στη βιολογία. Οι ερευνητές ελπίζουν με την πάροδο του χρόνου οι καταγραφείς να γίνουν πρότυπο σε όλη την πειραματική βιολογία.

[...]

Ο  Jeff Nivala, ερευνητής στο τμήμα γενετικής στην Ιατρική Σχολή του Χάρβαρντ, πιστεύει ότι οι ερευνητές μπορούν τώρα να αναζητήσουν νέους τρόπους χρήσης της τεχνολογίας, όπως ο προγραμματισμός των βακτηρίων του εντέρου για την καταγραφή πληροφοριών σχετικά με τη διατροφή ή την υγεία σας. «Ο γιατρός σας θα μπορούσε να χρησιμοποιήσει αυτά τα δεδομένα για τη διάγνωση και την παρακολούθηση μιας νόσου», είπε ο Nivala.

Ενώ ο Nivala πιστεύει ότι οι μικροσκοπικές κάμερες που θα κάνουν “σερφ” στο σώμα και τον εγκέφαλό μας θα γίνουν πραγματικότα στο μέλλον, λέει ότι αυτό μπορεί να είναι λίγο μακριά. Ειδικά δεδομένου ότι η κατασκευή μηχανών σε μοριακή κλίμακα είναι μια πρόκληση. «Ρεαλιστικά, μάλλον απέχουμε πολύ από το να καταγράφει κάθε κύτταρο στον εγκέφαλο τη συναπτική του δραστηριότητα», είπε. «Το σύστημα CRISPR-Cas είναι προκαρυωτικό, πράγμα που σημαίνει ότι υπάρχουν ορισμένες προκλήσεις που πρέπει να ξεπεραστούν κατά τη μεταφορά αυτών των γονιδίων σε κύτταρα θηλαστικών, ιδιαίτερα όταν δεν γνωρίζουμε ακριβώς πώς λειτουργεί κάθε μέρος του συστήματος CRISPR-Cas στα βακτήρια».

Ωστόσο, πιστεύει ότι όταν συμβεί αυτό θα οφείλεται στη συνένωση της βιολογίας και της τεχνολογίας. «Πόσο μικρή μπορούμε να φτιάξουμε μια ψηφιακή συσκευή εγγραφής χρησιμοποιώντας συμβατικά υλικά όπως μέταλλο, πλαστικό και πυρίτιο; Η απάντηση είναι ότι δεν είμαστε καν κοντά στο να επιτύχουμε την ακρίβεια και την λεπτότητα με την οποία η βιολογία μπορεί να κατασκευάσει συσκευές νανοκλίμακας», είπε ο Nivala. Αλλά δεν πρέπει να νιώθουμε άσχημα για αυτό, πρόσθεσε. «Η φύση είχε μόνο μερικά δισεκατομμύρια χρόνια προβάδισμα. Γι' αυτό οι μηχανικοί στρέφονται τώρα στη βιολογία για νέους τρόπους να κατασκευάσουν τα πράγματα σε μοριακή κλίμακα. Και όταν χτίζετε τεχνολογία από βιολογία, τότε είναι πολύ πιο εύκολο να διασυνδέεστε και να συνδεθείτε με φυσικά βιολογικά συστήματα», είπε ο Nivala. Είναι βέβαιος ότι αυτή η τρέχουσα εργασία θέτει τα θεμέλια για ένα σύστημα βιολογικής καταγραφής βασισμένο σε κύτταρα που μπορεί να συνδυαστεί με αισθητήρες που επιτρέπουν στο σύστημα να ανιχνεύει οποιοδήποτε σχετικό βιομόριο.

Θα μπορούσαν όλα αυτά να οδηγήσουν σε κωδικοποίηση πληροφοριών στο DNA μας, όπως τα ιατρικά μας αρχεία ή τον αριθμό Κοινωνικής Ασφάλισης ή τα στοιχεία της πιστωτικής μας κάρτας;

Σε έναν βαθμό, αυτό συμβαίνει ήδη στην εταιρεία μηχανών αυτόματης πώλησης Three Square Market, στο Ουισκόνσιν. Περίπου 50 από τους υπαλλήλους της εταιρείας αποδέχθηκαν την πρόταση του εργοδότη τους να εμφυτευτεί στα χέρια τους ένα ηλεκτρομαγνητικό μικροτσίπ. Μπορούν να το χρησιμοποιήσουν για να αγοράσουν φαγητό στη δουλειά, να συνδεθούν στους υπολογιστές τους και να λειτουργήσουν τον εκτυπωτή. Έχει το μέγεθος ενός κόκκου ρυζιού και είναι παρόμοιο με τα τσιπ που εμφυτεύονται σε κατοικίδια για σκοπούς αναγνώρισης και παρακολούθησης. Ωστόσο, αυτό το τσιπ έχει απόσταση λειτουργίας μόλις 6 ίντσες. Η BioHax International, ο σουηδός κατασκευαστής του τσιπ, θέλει να χρησιμοποιήσει τελικά το τσιπ για ευρύτερες εμπορικές εφαρμογές.

Αυτή είναι μόνο η αρχή των πιθανοτήτων, σύμφωνα με τον Nivala, ο οποίος πιστεύει ότι μια μέρα τα πιο σημαντικά δεδομένα μας θα αποθηκευτούν στο κυτταρικό μας DNA. «Κατά κάποιον τρόπο, μερικά από αυτά είναι ήδη. Το γονιδίωμά μας είναι πολύ σημαντικό. Φανταστείτε όμως να μπορούσαμε να αποθηκεύσουμε όλο το οικογενειακό μας ιατρικό ιστορικό, τις φωτογραφίες και τα οικογενειακά βίντεο σε κύτταρα γεννητικής ακολουθίας, τα οποία θα μπορούσαν στη συνέχεια να περάσουν στα παιδιά μας μέσα στο γονιδίωμά τους», είπε ο Nivala. «Ίσως θα μπορούσατε να αποθηκεύσετε ακόμη και τη καταπληκτική συνταγή για λαζάνια της μητέρας σας. Βάζω στοίχημα ότι οι μελλοντικές γενιές θα ήταν πολύ ευγνώμονες για αυτό».

Can We Encode Medical Records Into Our DNA? 13/8/2017
https://www.healthline.com/health-news/can-we-encode-medical-records-into-our-dna#Encoding-personal-information-into-our-DNA

Cyborg #24

Εργαλείο της εταιρείας Illumina για την ανάγνωση αλληλουχιών DNA που περιέχουν ψηφιακά δεδομένα, όπως φωτογράφιες και βίντεο.

Η DARPA θέλει να δημιουργήσει μια μηχανή αναζήτησης εικόνων από DNA

Οι περισσότεροι άνθρωποι χρησιμοποιούν τη δυνατότητα αναζήτησης εικόνων της Google είτε για να ερευνήσουν τυχόν παραβίαση πνευματικών δικαιωμάτων είτε για αγορές. Είδατε κάποια παπούτσια που σας αρέσουν στο Instagram; Η αναζήτηση μετά θα εμφανίσει όλες τις εικόνες που ταιριάζουν, συμπεριλαμβανομένων των ιστότοπων που θα σας πουλήσουν το ίδιο ζευγάρι. Για να γίνει αυτό, οι αλγόριθμοι υπολογιστικής όρασης της Google έπρεπε να εκπαιδευτούν ώστε να εξάγουν χαρακτηριστικά αναγνώρισης όπως τα χρώματα, οι υφές και τα σχήματα από έναν τεράστιο κατάλογο εικόνων. Ο Luis Ceze, ένας επιστήμονας υπολογιστών στο Πανεπιστήμιο της Ουάσιγκτον (UW), θέλει να κωδικοποιήσει την ίδια διαδικασία απευθείας στο DNA, κάνοντας τα ίδια τα μόρια να εκτελέσουν αυτή τη λειτουργία της όρασης υπολογιστή. Και θέλει να το κάνει χρησιμοποιώντας τις φωτογραφίες σας.

Την Τετάρτη, η ομάδα του Ceze στο UW ξεκίνησε μια καμπάνια στα μέσα κοινωνικής δικτύωσης για τη συλλογή 10.000 εικόνων από όλο τον κόσμο και τη αποθήκευση των pixel τους σε A, T, C και G που αποτελούν τα δομικά στοιχεία της ζωής. Έχουν κάνει κάτι τέτοιο στο παρελθόν. Το 2016 κωδικοποίησαν ένα ολόκληρο μουσικό βίντεο, θέτοντας το ρεκόρ για την μεγαλύτερη ποσότητα δεδομένων που αποθηκεύτηκαν στο DNA. Αλλά αυτή τη φορά αποφάσισαν να συγκεντρώσουν τα δεδομένα, δημιουργώντας ένα site όπου θα μπορει ο καθένας να ανεβάσει τις φωτογραφίες του και ενθαρρύνοντας τους χρήστες να μοιράζονται τις εικόνες τους στα μέσα κοινωνικής δικτύωσης με το hashtag #MemoriesInDNA. «Το DNA μπορεί να διαρκέσει χιλιάδες χρόνια», λέει ο Ceze. «Αρα αυτό είναι ουσιαστικά μια χρονοκάψουλα. Τι θα θέλατε να διατηρήσετε για πάντα;»

Η καμπάνια #MemoriesInDNA του UW μπορεί να είναι ένα μικρό τέχνασμα - υπάρχουν πολλές διαθέσιμες, υψηλής ποιότητας βάσεις δεδομένων εικόνων με τις οποίες μπορεί να εκπαιδευτεί μια μηχανή μοριακής αναζήτησης. Αλλά η επιστήμη πίσω από αυτό είναι μια πραγματική προσπάθεια να ανατραπούν οι τελευταίες έξι δεκαετίες υπολογιστών. Η αποθήκευση με βάση το DNA μέχρι στιγμής ήταν καλή μόνο για αυτό: την κωδικοποίηση pixel και το “κλείδωμά” τους σε έλικες DNA αόρατες στο ανθρώπινο μάτι. Μέχρι στιγμής, κανείς δεν έχει καταλάβει πώς να ανακτήσει και να επεξεργαστεί τα δεδομένα που είχαν αποθηκευτεί στο DNA - ένα απαραίτητο πρώτο βήμα για τη δημιουργία κάθε είδους σοβαρής πλατφόρμας μοριακών υπολογιστών.

Ποιος θα το ήθελε αυτό όμως; Ε λοιπόν, η DARPA σίγουρα.

Τους τελευταίους μήνες, η υπηρεσία του Υπουργείου Άμυνας που έχει αναλάβει να χρηματοδοτεί τις πιο μακρινές ελπίδες της επιστήμης έχει αρχίσει να επενδύει εκατομμύρια στην ανακάλυψη ριζοσπαστικών, μη δυαδικών τρόπων εργασίας με δεδομένα. «Τα μόρια προσφέρουν μια πολύ διαφορετική προσέγγιση στον “υπολογισμό”, σε σχέση με τα 0 και 1 των υπαρχόντων ψηφιακών μας συστημάτων», λέει η Anne Fischer, υπεύθυνη προγράμματος για το πρόγραμμα Molecular Informatics της Darpa, το οποίο μέχρι στιγμής έχει προσφέρει 15,3 εκ. δολάρια σε αντίστοιχα προτζεκτ στο Χάρβαρντ, στο Μπράουν, στο Πανεπιστήμιο του Ιλινόις και στο Πανεπιστήμιο της Ουάσιγκτον. «Η παγκόσμια κοινότητα δημιουργεί δεδομένα με τεράστιο ρυθμό και η ανάπτυξη νέων προσεγγίσεων για την πρόσβαση και την επεξεργασία αυτών των πληροφοριών είναι κρίσιμης σημασίας για την αντιμετώπιση των διαφαινόμενων ελλείψεων στη χωρητικότητα αποθήκευσης και την υπολογιστική ταχύτητα».

Η ψηφιακή εποχή ξεκίνησε με μια απλή πράξη ανάθεσης: ο άνθρωπος αναθέτει την μνήμη στη μηχανή. Πρώτα σε σωλήνες κενού, μετά σε τρανζίστορ και μαγνητικούς δίσκους. Μετά από περισσότερα από 60 χρόνια, η βασική αρχιτεκτονική που βασίζεται στη λογική που περιγράφεται από τον John von Neumann εξακολουθεί να βρίσκεται κάτω από τις σύγχρονες υποδομές υπολογιστών. Και με κάθε μέτρο έχει εξυπηρετήσει καλά την ανθρωπότητα. Όμως τα όριά της γίνονται εμφανή καθώς οι άνθρωποι δημιουργούν όλο και πιο περίπλοκα δεδομένα.

«Ο νόμος του Moore έχει να κάνει με τη σμίκρυνση των συσκευών», λέει η Karin Strauss, ανώτερη επιστήμονας στη Microsoft και συνεργάτης στο πρότζεκτ του Πανεπιστημίου της Ουάσιγκτον. «Τα ηλεκτρονικά είναι υπέροχα και θα συνεχίσουν να υπάρχουν φυσικά, αλλά τα μόρια είναι το τελευταίο σύνορο όταν πρόκειται για τη σμίκρυνση». Η Χημεία προσφέρει μια αναξιοποίητη παλέτα μοριακής ποικιλομορφίας - ιδιότητες όπως η δομή, το μέγεθος, το φορτίο και η πολικότητα - που θα μπορούσε να αξιοποιηθεί για την επεξεργασία πληροφοριών.

Το DNA δεν είναι το μόνο μόριο για το οποίο ενδιαφέρεται η DARPA. Η Brenda Rubenstein είναι θεωρητική χημικός στο Μπράουν, όπου εργάστηκε στον κβαντικό υπολογισμό - κωδικοποιώντας κομμάτια πληροφοριών είτε ως άτομα, ιόντα, φωτόνια ή ηλεκτρόνια. Αλλά τώρα επεκτείνει αυτή την ιδέα σε οργανικές ενώσεις, ειδικά σε εκείνες που έχουν πολλαπλές θέσεις για να προσκολληθούν οι ομάδες R (R-groups: τα μεταβλητά μέρη των μορίων που τους προσδίδουν διαφορετικές φυσικές και χημικές ιδιότητες). Η εκτέλεση διαφορετικών αντιδράσεων τροποποιεί αυτές τις ομάδες R με προβλέψιμους τρόπους, γεγονός που τις καθιστά καλές για τον υπολογισμό βασικών εξισώσεων γραμμικής άλγεβρας, λέει η Rubenstein. «Έχουν τόσες πολλές ιδιότητες, υπάρχει μια απίστευτη ικανότητα αποθήκευσης και επεξεργασίας πληροφοριών», λέει. «Νομίζω ότι τα μικρά μόρια είναι σχεδόν μια προφανής επιλογή για τη διεύρυνση του πεδίου εφαρμογής των υπολογιστών».

Darpa Wants to Build an Image Search Engine out of DNA. And your photos could end up in its database. 24/1/2018
https://www.wired.com/story/darpa-wants-to-build-an-image-search-engine-out-of-dna/

DNA: Το datacenter της φύσης

Η IARPA αναζητά τεχνολογίες μοριακής αποθήκευσης πληροφοριών (molecular information storage technologies - MIST) που μπορούν να συγκρατούν τεράστιες ποσότητες δεδομένων σε ένα μικρό αποτύπωμα για μεγάλες περιόδους χωρίς φθορά και που είναι αρκετά προχωρημένες στην ερευνητική διαδικασία ώστε να είναι εμπορικά βιώσιμες μέσα σε 10 χρόνια. Το DNA θα μπορούσε να καλύψει όλες αυτές τις προϋποθέσεις, σύμφωνα με μια ανακοίνωση της υπηρεσίας που κυκλοφόρησε αυτή την εβδομάδα.

Η αποθήκευση μοριακών πληροφοριών ήταν μια θεωρητική ιδέα εδώ και δεκαετίες, αλλά πρόσφατα έφτασε σε ορισμένα σημαντικά ορόσημα. Το 2016, ερευνητές στο Πανεπιστήμιο της Ουάσιγκτον και το Microsoft Research μπόρεσαν να κωδικοποιήσουν τέσσερις ψηφιακές εικόνες στο DNA και στη συνέχεια να τις ανακτήσουν με επιτυχία, χωρίς απώλεια δεδομένων. Εάν τελειοποιηθούν αυτές οι μέθοδοι μοριακής αποθήκευσης, θα μπορούσαν να προσφέρουν πυκνότητες αποθήκευσης πληροφοριών 10 εκατομμύρια φορές μεγαλύτερες από τις τρέχουσες τεχνικές. Θα μπορούσαν επίσης να διατηρήσουν τα δεδομένα ανέπαφα για εκατοντάδες χρόνια, μειώνοντας σημαντικά το κόστος λειτουργίας και συντήρησης, σύμφωνα με την IARPA.

Η IARPA συναντήθηκε με ενδιαφερόμενους φορείς το 2016 και το 2017, αλλά τώρα θέλει να κάνει την τεχνολογία πραγματικότητα, επομένως σχεδιάζει να αναπτύξει το πρόγραμμα MIST. «Ο θεμελιώδης στόχος του προγράμματος MIST είναι να αναπτύξει τεχνολογίες αποθήκευσης που μπορούν τελικά να επεκταθούν στο “καθεστώς” των exabyte και πιο πέρα, με μειωμένο φυσικό αποτύπωμα, ισχύ και απαιτήσεις κόστους σε σχέση με τις συμβατικές τεχνολογίες αποθήκευσης», αναφέρει η πρόσκληση.

H υπηρεσία αναζητά λύσεις από έναν αριθμό πεδίων - συμπεριλαμβανομένης της χημείας, της μοριακής βιολογίας και της μικρορευστικότητας - που θα μπορούσαν να τροφοδοτήσουν το MIST. Στόχος του είναι να μπορεί να αποθηκεύει και να ανακτά δεδομένα από μια λύση αποθήκευσης MIST και να έχει ένα λειτουργικό σύστημα που βοηθά στη διευκόλυνση της διαδικασίας. Το πρόγραμμα MIST, το οποίο θα αποτελείται από δύο διετείς φάσεις, αναμένεται να ξεκινήσει αργότερα φέτος με ένα διήμερο εργαστήριο στην περιοχή της Ουάσιγκτον.

DNA: Nature's data center - The Intelligence Advanced Research Projects Activity is looking for a new storage medium that can hold more data within a smaller footprint. Is DNA the answer? 28/2/2018
https://gcn.com/data-analytics/2018/02/dna-natures-data-center/296110/

Cyborg #24

Ένα ψηφιακό πρωτότυπο που αυτοματοποιεί τα βήματα της DNA αποθήκευσης δεδομένων. Ένα μόνο σταγονίδιο (εδώ βαμμένο μπλε) θα μπορούσε να μεταφέρει πολλά terabyte πληροφοριών.

Επαναπρογραμματιζόμενος υπολογιστής DNA

Το DNA υποτίθεται ότι θα μας σώσει από το τέλμα των υπολογιστών. Με τις προόδους που χρησιμοποιούν το πυρίτιο να εξασθενούν, οι υπολογιστές που βασίζονται σε DNA υπόσχονται τεράστιες αρχιτεκτονικές παράλληλων υπολογιστών που είναι αδύνατες σήμερα.

Αλλά υπάρχει ένα πρόβλημα: Τα μοριακά κυκλώματα που έχουν κατασκευαστεί μέχρι τώρα δεν έχουν καθόλου ευελιξία. Σήμερα, η χρήση του DNA για υπολογισμούς είναι «σαν να χρειάζεται να φτιάξεις έναν νέο υπολογιστή από νέο υλικό, μόνο για να τρέξεις ένα νέο λογισμικό», λέει ο επιστήμονας υπολογιστών David Doty. Έτσι, ο Doty, καθηγητής στο UC Davis, και οι συνάδελφοί του ξεκίνησαν να δουν τι θα χρειαζόταν ώστε να υλοποιηθεί ένας DNA υπολογιστής που να είναι στην πραγματικότητα επαναπρογραμματιζόμενος.

Όπως περιγράφεται λεπτομερώς σε μια εργασία που δημοσιεύτηκε αυτή την εβδομάδα στο Nature, ο Doty και οι συνάδελφοί του από το Caltech και το Πανεπιστήμιο Maynooth απέδειξαν ακριβώς αυτό. Έδειξαν ότι είναι δυνατό να χρησιμοποιηθεί ένα απλό “έναυσμα” ώστε να “πειστεί” το ίδιο βασικό σύνολο μορίων DNA να εφαρμόσει πολλούς διαφορετικούς αλγόριθμους. Αν και αυτή η έρευνα είναι ακόμα διερευνητική, θα μπορούσαν να χρησιμοποιηθούν επαναπρογραμματιζόμενοι μοριακοί αλγόριθμοι στο μέλλον για τον προγραμματισμό DNA-ρομπότ, τα οποία έχουν ήδη χρησιμοποιηθεί με επιτυχία για την παράδοση φαρμάκων σε καρκινικά κύτταρα.

[...]

Αυτό το πείραμα ήταν «βασική επιστήμη» στην πιο καθαρή της μορφή, μια απόδειξη της ιδέας που παρήγαγε όμορφα, αν και άχρηστα, αποτελέσματα. Όμως, σύμφωνα με τον Petr Sulc, επίκουρο καθηγητή στο Ινστιτούτο Biodesign του Πανεπιστημίου της Αριζόνα που δεν συμμετείχε στην έρευνα, η ανάπτυξη επαναπρογραμματιζόμενων μοριακών αλγορίθμων για συναρμολόγηση νανοκλίμακας ανοίγει την πόρτα σε ένα ευρύ φάσμα πιθανών εφαρμογών. Ο Sulc πρότεινε ότι αυτή η τεχνική μπορεί μια μέρα να είναι χρήσιμη για τη δημιουργία εργοστασίων νανοκλίμακας που θα συναρμολογούν μόρια ή μοριακά ρομπότ για τη διανομή φαρμάκων. Είπε ότι μπορεί επίσης να συμβάλει στην ανάπτυξη νανοφωτονικών υλικών που θα μπορούσαν να ανοίξουν το δρόμο για υπολογιστές που βασίζονται στο φως και όχι στα ηλεκτρόνια.

«Με αυτούς τους τύπους μοριακών αλγορίθμων, μια μέρα μπορεί να είμαστε σε θέση να συναρμολογήσουμε οποιοδήποτε σύνθετο αντικείμενο σε επίπεδο νανοκλίμακας, χρησιμοποιώντας ένα γενικό προγραμματιζόμενο σετ “στοιχείων”, όπως τα ζωντανά κύτταρα μπορούν να συγκεντρωθούν σε ένα κύτταρο οστού ή σε ένα κύτταρο νευρώνα απλώς επιλέγοντας ποιες πρωτεΐνες εκφράζονται», λέει ο Sulc.

Finally! A DNA Computer That Can Actually Be Reprogrammed. DNA computers have to date only been able to run one algorithm, but a new design shows how these machines can be made more flexible—and useful. 21/3/2019
https://www.wired.com/story/finally-a-dna-computer-that-can-actually-be-reprogrammed/

Η IARPA επενδύει στην DNA αποθήκευση δεδομένων

Η Intelligence Advanced Research Projects Activity απένειμε συνολικά 48 εκ. δολάρια σε δύο ομάδες που επιδιώκουν να αναπτύξουν την ψηφιακή αποθήκευση δεδομένων με συνθετικό DNA.

Η Κοινοπραξία Μοριακής Κωδικοποίησης (Molecular Encoding Consortium), με επικεφαλής τον Robert Nicol του Broad Institute, ανακοίνωσε την Τετάρτη ένα βραβείο 23 εκ. δολαρίων από το πρόγραμμα αποθήκευσης μοριακών πληροφοριών (MIST) της IARPA. Η κοινοπραξία περιλαμβάνει επίσης την ερευνητική ομάδα Donhee Ham στο Πανεπιστήμιο του Χάρβαρντ και την DNA Script, μια γαλλική νεοσύστατη εταιρεία συνθετικού DNΑ. Σε μια δήλωση, τα μέλη της κοινοπραξίας είπαν ότι σχεδίαζαν να συνεργαστούν με την Illumina για την αποκωδικοποίηση δεδομένων που είναι αποθηκευμένα στο DNA χρησιμοποιώντας ανάλυση αλληλουχίας επόμενης γενιάς.

Η IARPA βράβευσε επίσης με 25 εκ. δολάρια στο Τεχνολογικό Ινστιτούτο Έρευνας της Τζόρτζια για το πρότζεκτ ενός επεκτάσιμου μοριακού αρχειακού λογισμικού και υλικού (SMASH). Η Twist Bioscience ανακοίνωσε την Τετάρτη ότι θα συνθέσει DNA για το έργο SMASH ως υπεργολάβος. Το SMASH θα περιλαμβάνει επίσης ομάδες από το Πανεπιστήμιο της Ουάσιγκτον (UW), τη Microsoft και την Roswell Biotechnologies.

Η IARPA ξεκίνησε το πρόγραμμά MIST το 2018 με στόχο την ανάπτυξη τεχνολογιών αποθήκευσης δεδομένων που θα κλιμακώνονται σε χωρητικότητα 1 δις gigabyte ή περισσότερο, με μειωμένο φυσικό αποτύπωμα και κατανάλωση ενέργειας. Το πρόγραμμα, το οποίο η IARPA αναμένει να διαρκέσει τέσσερα χρόνια, θα διερευνήσει τεχνολογίες σε τρεις τεχνικούς τομείς: την αποθήκευση, την ανάκτηση και τα λειτουργικά συστήματα.

Ως μέρος του βραβείου SMASH, 5,5 εκ. δολάρια προορίζονται για ένα νέο σχέδιο τσιπ CMOS που θα επιτρέψει τη εγγραφή DNA χρησιμοποιώντας την αποτελεσματικότητα της τρέχουσας τεχνολογίας ημιαγωγών. Η Georgia Tech θα διεξαγάγει αυτήν την έρευνα, αλλά η Twist είπε ότι θα εφαρμόσει το σχέδιο εμπορικά. Ερευνητές του UW και της Microsoft θα συνεισφέρουν στην αρχιτεκτονική του συστήματος, την ανάλυση δεδομένων και την τεχνογνωσία στην ανάπτυξη λογισμικού. Η Roswell Biotechnologies θα παρέχει επίσης ένα τσιπ και μια πλατφόρμα ανάγνωσης δεδομένων DNA υψηλής απόδοσης.

IARPA Commits $48M to DNA Data Storage. 15/1/2020
https://www.genomeweb.com/informatics/iarpa-commits-48m-dna-data-storage

Πώς να αποθηκεύσουμε όλα τα data στο DNA

[...] Εκτός από το κόστος, το άλλο σημαντικό πρόβλημα στη χρήση του DNA για την αποθήκευση δεδομένων είναι η δυσκολία να διαλέξουμε το αρχείο που θέλουμε από όλα τα άλλα. «Αν υποθέσουμε ότι οι τεχνολογίες για τη γραφή DNA φτάνουν σε ένα σημείο όπου είναι οικονομικά αποδοτικό να γράψουμε ένα exabyte ή zettabyte δεδομένων στο DNA, μετά τί; Θα έχουμε ένα σωρό DNA, αμέτρητα αρχεία, εικόνες, ταινίες και άλλα πράγματα, ανάμεσα στα οποία θα πρέπει να βρούμε τη μία φωτογραφία ή ταινία που ψάχνουμε», λέει ο Bathe. «Είναι σαν να προσπαθούμε να βρούμε μια βελόνα στα άχυρα».

Επί του παρόντος, τα DNA αρχεία ανακτώνται συμβατικά χρησιμοποιώντας PCR (polymerase chain reaction). Κάθε DNA αρχείο δεδομένων περιλαμβάνει μια αλληλουχία που συνδέεται με ένα συγκεκριμένο PCR αναγνωριστικό. Για να βρείτε ένα συγκεκριμένο αρχείο, αυτό το αναγνωριστικό προστίθεται στο δείγμα ώστε να βρεθεί και να ενισχυθεί η επιθυμητή ακολουθία. Ωστόσο, ένα μειονέκτημα αυτής της προσέγγισης είναι ότι μπορεί να υπάρξει αλληλεπίδραση μεταξύ του αναγνωριστικού και άλλων αλληλουχιών DNA εκτός στόχου, με αποτέλεσμα να “ανασυρθούν” διαφορετικά αρχεία από τα επιθυμητά. Επίσης, η διαδικασία ανάκτησης PCR απαιτεί ένζυμα και καταλήγει να καταναλώνει το μεγαλύτερο μέρος του DNA που υπήρχε στη δεξαμενή. «Καίμε τα άχυρα για να βρούμε τη βελόνα, γιατί όλο υπόλοιπο DNA δεν χρησιμοποιείται και ουσιαστικά πετιέται», λέει ο Bathe.
Ως εναλλακτική προσέγγιση, η ομάδα του MIT ανέπτυξε μια νέα τεχνική ανάκτησης που περιλαμβάνει την ενθυλάκωση κάθε αρχείου DNA σε ένα μικρό σωματίδιο πυριτίου. Κάθε κάψουλα φέρει ετικέτα με μονόκλωνα DNA “barcodes” που αντιστοιχούν στα περιεχόμενα του αρχείου. Για να αποδείξουν αυτή την προσέγγιση με οικονομικά αποδοτικό τρόπο, οι ερευνητές κωδικοποίησαν 20 διαφορετικές εικόνες σε κομμάτια DNA μήκους περίπου 3.000 νουκλεοτιδίων, που ισοδυναμούν με περίπου 100 byte. (Έδειξαν επίσης ότι οι κάψουλες μπορούσαν να χωρέσουν αρχεία DNA έως και ένα gigabyte σε μέγεθος.)

Κάθε αρχείο έφερε barcodes που αντιστοιχούν σε ετικέτες όπως «γάτα» ή «αεροπλάνο». Όταν οι ερευνητές θέλουν να βγάλουν μια συγκεκριμένη εικόνα, αφαιρούν ένα δείγμα του DNA και προσθέτουν αναγνωριστικά που αντιστοιχούν στις ετικέτες που αναζητούν — για παράδειγμα, «γάτα», «πορτοκαλί» και «άγρια» για μια εικόνα μιας τίγρης, ή «γάτα», «πορτοκαλί» και «οικιακό» για σπιτόγατα. Τα αναγνωριστικά φέρουν ετικέτα με φθορίζοντα ή μαγνητικά σωματίδια, καθιστώντας εύκολη την αφαίρεση και τον εντοπισμό τυχόν αντιστοιχιών από το δείγμα. Αυτό επιτρέπει την αφαίρεση του επιθυμητού αρχείου ενώ αφήνει ανέπαφο το υπόλοιπο DNA για να αποθηκευτεί ξανά. Αυτή η διαδικασία ανάκτησής επιτρέπει την χρήση λογικών δηλώσεων Boole, όπως "πρόεδρος ΚΑΙ 18ος αιώνας" με αποτέλεσμα τον George Washington, παρόμοια με αυτήν που υπάρχει στις αναζητήσεις εικόνων στο Google.

[...] Ο George Church, καθηγητής γενετικής στην Ιατρική Σχολή του Χάρβαρντ, περιγράφει την τεχνική ως «ένα τεράστιο άλμα για τη διαχείριση της γνώσης και την τεχνολογία αναζήτησης». «Η ταχεία πρόοδος στη γραφή, την αντιγραφή, την ανάγνωση και την αποθήκευση αρχειακών δεδομένων χαμηλής ενέργειας σε μορφή DNA, έχει ξεπεράσει τις ελάχιστα εξερευνημένες ευκαιρίες για μια ακριβή ανάκτηση αρχείων από τεράστιες βάσεις δεδομένων», λέει ο Church, που δεν συμμετέχει στη μελέτη. «Η νέα μελέτη αντιμετωπίζει θεαματικά αυτό το πρόβλημα, χρησιμοποιώντας ένα εντελώς ανεξάρτητο εξωτερικό στρώμα DNA και αξιοποιώντας διαφορετικές ιδιότητες του DNA - τον υβριδισμό (hybridization) αντί για την αλληλούχιση (sequencing) - και επιπλέον, χρησιμοποιώντας ήδη υπάρχοντα όργανα και χημικές ουσίες».

Ο Mark Bathe, καθηγητής βιολογικής μηχανικής του MIT, οραματίζεται ότι αυτό το είδος ενθυλάκωσης DNA θα μπορούσε να είναι χρήσιμο για την αποθήκευση «ψυχρών» δεδομένων, δηλαδή δεδομένων που φυλάσσονται σε μια βάση και δεν αναζητούνται πολύ συχνά. Το εργαστήριό του δημιουργεί μια startup, την Cache DNA, που τώρα αναπτύσσει τεχνολογία για μακροπρόθεσμη αποθήκευση DNA, τόσο για αποθήκευση δεδομένων DNA μακροπρόθεσμα, όσο και για κλινικά και άλλα προϋπάρχοντα δείγματα DNA βραχυπρόθεσμα. «Αν και μπορεί να περάσει αρκετός καιρός μέχρι να καταστεί βιώσιμο το DNA ως μέσο αποθήκευσης δεδομένων, υπάρχει ήδη μια πιεστική ανάγκη σήμερα για  λύσεις χαμηλού κόστους μαζικής αποθήκευσης, για προϋπάρχοντα δείγματα DNA και RNA από τα τεστ για την Covid-19, την αλληλουχία του ανθρώπινου γονιδιώματος και άλλους τομείς της γονιδιωματικής», λέει ο Bathe.

(Η έρευνα χρηματοδοτήθηκε από το Γραφείο Ναυτικών Ερευνών, το Εθνικό Ίδρυμα Επιστημών και το Γραφείο Ερευνών του Στρατού των ΗΠΑ.)

Could all your digital photos be stored as DNA? - World Economic Forum & ΜΙΤ. 16/7/2021
https://www.weforum.org/agenda/2021/06/research-shows-dna-could-be-a-solution-to-the-world-s-data-storage-problem/

Cyborg #24

Ο πρώτος εγγραφέας DNA της CATALOG.

Ο πρώτος εγγραφέας δεδομένων σε DNA

Η CATALOG με έδρα τη Βοστώνη είναι ο ηγέτης στην αποθήκευση ψηφιακών δεδομένων με βάση το DNA και μόλις εξασφάλισε χρηματοδότηση 35 εκ. δολαρίων για να προχωρήσει στην ανάπτυξη μιας υπολογιστικής πλατφόρμας όπου τόσο η διαχείριση δεδομένων όσο και ο υπολογισμός πραγματοποιούνται μέσω συνθετικού DNA. Τα συστήματα υπολογιστών DNA που βασίζονται σε χημικά προσφέρουν προστασία με «κενό αέρα», είναι απρόσβλητα σε παραδοσιακές ευπάθειες ηλεκτρονικής ασφάλειας, έχουν χαμηλό φυσικό αποτύπωμα και καταναλώνουν λίγη - και σε ορισμένες περιπτώσεις μηδενική - ενέργεια για την αποθήκευση και τον χειρισμό δεδομένων.

Το ιδιόκτητο σχήμα κωδικοποίησης δεδομένων της CATALOG και η νέα προσέγγιση στον αυτοματισμό επιδιώκει να ξεκλειδώσει τα μέσα για την ενσωμάτωση του DNA σε αλγόριθμους και εφαρμογές με πιθανή ευρεία εμπορική χρήση. Αναμενόμενοι τομείς εφαρμογής είναι η τεχνητή νοημοσύνη, η μηχανική μάθηση, η ανάλυση δεδομένων και η ασφάλεια. Επιπλέον, οι περιπτώσεις αρχικής χρήσης αναμένεται να περιλαμβάνουν τον εντοπισμό απάτης σε χρηματοοικονομικές υπηρεσίες, την επεξεργασία εικόνας για ανακάλυψη ελαττωμάτων στην βιομηχανία και την επεξεργασία ψηφιακού σήματος στον ενεργειακό τομέα.

«Η απλή διατήρηση δεδομένων στο DNA δεν είναι ο τελικός μας στόχος», δήλωσε ο Hyunjun Park, ιδρυτικό μέλος και διευθύνων σύμβουλος της CATALOG. «Η CATALOG θα αλλάξει θεμελιωδώς την οικονομία δεδομένων επιτρέποντας στις επιχειρήσεις να αναλύουν και να δημιουργούν επιχειρηματική αξία με ασφάλεια, από δεδομένα που προηγουμένως θα είχαν πεταχτεί ή αρχειοθετηθεί σε ψυχρή αποθήκευση. Η πιθανότητα μιας εξαιρετικά επεκτάσιμης, με χαμηλή ενέργεια και δυνητικά φορητής πλατφόρμας DNA-υπολογιστών είναι μέσα στις δυνατότητές μας».
Ο πρώτος εγγραφέας DNA της CATALOG, Shannon, πήρε το όνομά του προς τιμήν του πατέρα της θεωρίας της πληροφορίας, Claude Shannon. Είναι ικανός για εκατοντάδες χιλιάδες χημικές αντιδράσεις ανά δευτερόλεπτο. Προς το παρόν παρέχει μόνο αποθήκευση, αλλά οι μελλοντικές εκδόσεις της αυτοματοποιημένης πλατφόρμας δεδομένων που βασίζεται σε DNA θα εισάγουν υπολογιστικές δυνατότητες. Αυτή θα είναι η πρώτη εμπορικά βιώσιμη και αυτοματοποιημένη πλατφόρμα για DNA αποθήκευση και υπολογισμό, για εταιρική χρήση.

DNA-based chemical computing could revolutionize the IT industry. 30/9/2021
https://betanews.com/2021/09/30/dna-based-computing-revolutionize-it/

H εποχή Yottabyte

Ένα kilobyte είναι 1000 bytes και ένα zettabyte είναι 1000⁷ bytes. Μεταξύ kilobyte και zettabyte, με δυνάμεις του 1000, υπάρχουν megabyte, gigabyte, terabyte, petabyte και exabyte. Μετά τα zettabytes έρχονται τα yottabytes. Το 2016, η Cisco ανακοίνωσε ότι βρισκόμαστε στην εποχή των Zettabyte, με την παγκόσμια επισκεψιμότητα στο Διαδίκτυο να φτάνει τα 1,2 zettabyte. Θα είμαστε στην εποχή Yottabyte πριν τελειώσει η δεκαετία.

Οι άνθρωποι εργάζονται για την DNA αποθήκευση για πολλά χρόνια. Έγραψα για πρώτη φορά για αυτό το 2016, όταν υπέθεσα ότι μπορεί να σημαίνει ότι θα μπορούσαμε κυριολεκτικά να είμαστε ο δικός μας ιατρικός φάκελος. Δεν βρισκόμαστε ακόμη στο στάδιο της πρακτικής αποθήκευσης στο DNA και πιθανότατα δεν θα είμαστε για πολλά ακόμη χρόνια, αλλά είναι δύσκολο να πιστέψουμε ότι δεν θα φτάσουμε εκεί τελικά. Σε αντίθεση με κάθε άλλη μορφή αποθήκευσης που έχουμε, το DNA μπορεί να αντέξει σχεδόν επ' αόριστον και εφόσον υπάρχουν ευφυή είδη που βασίζονται στο DNA, θα θέλουν να το διαβάσουν. Το πιο σημαντικό είναι ότι το DNA μπορεί να αποθηκεύσει πολλά δεδομένα. Όπως είπε ο καθηγητής του MIT Mark Bathe: «Όλα τα δεδομένα στον κόσμο θα μπορούσαν να χωρέσουν στο φλιτζάνι του καφέ που πίνεις το πρωί, αν ήταν αποθηκευμένα στο DNA».

Αυτό που με ώθησε να γράψω για αυτό τώρα ήταν μια ανακοίνωση από τη Microsoft. Σε συνεργασία με ερευνητές από το Εργαστήριο Μοριακών Πληροφοριών στο Πανεπιστήμιο της Ουάσιγκτον, η εργασία τους παρουσίασε μια «απόδειξης της ιδέας» για έναν μοριακό ελεγκτή που τους επέτρεπε να γράφουν στο DNA εως και με «τρεις τάξεις μεγέθους» - δηλαδή 1000x – πυκνότερα. Όπως έλεγε η ανακοίνωση: «Τελικά, μπορέσαμε να χρησιμοποιήσουμε το σύστημα για να κωδικοποιήσουμε ένα μήνυμα σε τέσσερις έλικες συνθετικού DNA και αυτό είναι μια απόδειξη ότι η εγγραφή DNA σε νανοκλίμακα είναι δυνατή σε διαστάσεις που είναι απαραίτητες για μια πρακτική DNA αποθήκευση δεδομένων».

Η δημοσίευση καταλήγει: «…προβλέπουμε ότι η τεχνολογία θα κλιμακωθεί περαιτέρω σε δισεκατομμύρια χαρακτηριστικά ανά τετραγωνικό εκατοστό, επιτρέποντας την διεκπεραίωση της σύνθεσης να φτάσει σε επίπεδα megabyte-ανά-δευτερόλεπτο σε μία μονάδα εγγραφής, που θα είναι ανταγωνιστική με τη διεκπεραίωση εγγραφής άλλων συσκευών αποθήκευσης. Προβλέπουμε ότι αυτοί οι “συναρμολογητές” θα χρησιμοποιηθούν σε άλλους τομείς όπως η επιστήμη των υλικών, η συνθετική βιολογία, η διάγνωση και οι πειραματικές δοκιμασίες μοριακής βιολογίας».

Ομοίως, η ανακοίνωση καταλήγει: «Προβλέπουμε ότι η τεχνολογία θα φτάσει σε συστοιχίες που θα περιέχουν δισεκατομμύρια ηλεκτρόδια ικανά να αποθηκεύουν megabyte δεδομένων ανά δευτερόλεπτο στο DNA. Αυτό θα φέρει την απόδοση της DNA αποθήκευσης δεδομένων και το κόστος πολύ πιο κοντά στην μαγνητική ταινία».

Για να μην νομίζει κανείς ότι μόνο η Microsoft εργάζεται πάνω σε αυτό, υπήρξαν πολλές άλλες ελπιδοφόρες εξελίξεις τις τελευταίες εβδομάδες. Η Interesting Engineering τόνισε μερικές από αυτές:

Οι ερευνητές του Georgia Tech Research Institute ανέπτυξαν ένα μικροτσίπ που επιτρέπει ταχύτερη εγγραφή στο DNA και αναμένουν ότι θα είναι 100 φορές ταχύτερο από τις τρέχουσες τεχνολογίες. Ο επικεφαλής ερευνητής Nicholas Guise είπε στο BBC ότι, εφόσον το DNA μπορεί να επιβιώσει τόσο πολύ, «το κόστος ιδιοκτησίας πέφτει σχεδόν στο μηδέν».

Οι επιστήμονες του Πανεπιστημίου Northwestern απέδειξαν ένα νέο «ενζυματικό σύστημα» που κωδικοποιεί τρία bit δεδομένων ανά ώρα. Η ανακοίνωση του πανεπιστημίου εξηγεί: «Η μέθοδός μας είναι πολύ φθηνότερη για την εγγραφή πληροφοριών, επειδή το ένζυμο που συνθέτει το DNA μπορεί να υποστεί άμεση χειραγώγηση». Οι ερευνητές πιστεύουν ότι η τεχνική θα μπορούσε να χρησιμοποιηθεί για την εγκατάσταση «μοριακών καταγραφέων» μέσα στα κύτταρα για να λειτουργήσουν ως βιοαισθητήρες. Οι πιθανότητες είναι εκπληκτικές.

Μια ομάδα στο Νοτιοανατολικό Πανεπιστήμιο της Κίνας χρησιμοποίησε μια νέα διαδικασία για να χωρίσει το περιεχόμενο των δεδομένων σε ακολουθίες, αντί σε μια μεγάλη ενιαία αλυσίδα, ενώ «μείωσε» τα εργαλεία που χρησιμοποιήθηκαν. Η TechRadar εικάζει ότι θα μπορούσε να οδηγήσει στην πρώτη συσκευή DNA αποθήκευσης για την μαζική αγορά. Ο καθηγητής Liu Hong είπε στους Global Times: «Τώρα στοχεύουμε στον συνδυασμό ηλεκτρονικής τεχνολογίας πληροφοριών και βιολογίας, που μπορεί να χρησιμοποιηθεί σε διάφορες πτυχές, συμπεριλαμβανομένης της αποθήκευσης δεδομένων και του νουκλεϊκού τεστ για ιούς».

Η Interesting Engineering μπορεί να έχει χάσει την πιο ενδιαφέρουσα χρήση μέχρι σήμερα: Το Business Insider India αναφέρει ότι η Roddenberry Entertainment δημιούργησε ένα NFT της υπογραφής του Gene Roddenberry στο πρώτο συμβόλαιο του Star Trek και το αποθήκευσε σε DNA εμφυτευμένο σε βακτήρια - «το πρώτο ζωντανό οικολογικό NFT». Τα βακτήρια είναι επί του παρόντος αδρανή, αλλά εάν αναζωογονηθούν, θα αντιγράψουν το NFT καθώς αναπαράγονται.

Είναι πιθανό η DNA αποθήκευση να μην γίνει ποτέ αρκετά γρήγορη ή αρκετά φθηνή για να αντικαταστήσει τις υπάρχουσες μεθόδους αποθήκευσης. Είναι πιθανό να προκύψει κάποια άλλη νέα τεχνική που θα είναι ακόμα καλύτερη από την DNA αποθήκευση. Αλλά είμαστε πλάσματα που βασίζονται στο DNA και η δυνατότητα χρήσης της τεχνικής με την οποία μας χτίζει η φύση για να αποθηκεύουμε και να χειριζόμαστε τα δεδομένα που παράγουμε είναι ακαταμάχητη.
Υπάρχουν ήδη «ρομπότ» που βασίζονται σε DNA και υπολογιστές που βασίζονται σε DNA, οπότε ειλικρινά, η DNA αποθήκευση δεν με εκπλήσσει καθόλου. Θα πρέπει να περιμένουμε μοριακούς DNA καταγραφείς - και να προσπαθούμε να προβλέψουμε πώς θα θέλαμε και πώς δεν θα θέλαμε να χρησιμοποιηθούν.

Στον 21ο αιώνα, η βιολογία είναι η πληροφορική και το αντίστροφο. Το DNA δεν είναι μόνο η γενετική ιστορία και το μέλλον μας, αλλά πληροφορίες που μπορούμε να διαβάσουμε και να γράψουμε. Το ονομάζουμε «συνθετική βιολογία» τώρα, αλλά καθώς το πεδίο μεγαλώνει, είναι πιθανό να ξεχάσουμε το «συνθετικό» κομμάτι, όπως η «ψηφιακή υγεία» μπορεί απλώς να γίνει «υγεία» ή το «κρυπτονόμισμα» να γίνει απλώς «νόμισμα».
Η ζωή στην εποχή Yottabyte θα είναι πολύ ενδιαφέρουσα.

DNA Storage in the Yottabyte Era. Demand for data storage is skyrocketing. 7/12/2021
https://onezero.medium.com/dna-storage-in-the-yottabyte-era-76c87235ced5

Wintermute

κορυφή