DNA로 구현하는 데이터 아카이브
DNA로 구현하는 데이터 아카이브
  • 정우빈 / 화공 조교수
  • 승인 2024.10.30 13:00
  • 댓글 0
이 기사를 공유합니다

▲그림 1. 최고의 정보 저장 소재 - DNA
▲그림 1. 최고의 정보 저장 소재 - DNA

우리는 디지털 시대의 급격한 발전 속에서 매년 엄청난 양의 데이터를 생성하고 있다. 전 세계 데이터는 2024년 현재 10제타바이트(ZB)를 넘어섰으며, 그 양은 앞으로도 기하급수적으로 증가할 것으로 예측된다. 데이터의 양이 늘어남에 따라 이를 보존하고 활용하는 기술의 중요성도 크게 증가하고 있다. 하지만, 기존의 데이터 저장 매체는 여러 가지 한계에 직면하고 있다. △하드 드라이브 △서버 △클라우드 스토리지와 같은 현재의 데이터 보존 방식은 막대한 에너지를 소모하고, 물리적 공간을 많이 차지할 뿐 아니라 장기 보존 시 데이터 손실의 위험성도 있다. 특히, 마그네틱테이프와 같은 매체는 수명이 짧아 몇십 년 내에 데이터 손실이 발생할 수 있다. 따라서 더 적은 공간에 더 많은 데이터를 안정적으로 보관할 수 있는 기술이 절실히 요구되고 있으며, 이런 필요성을 충족시키기 위해 등장한 것이 바로 DNA를 이용한 데이터 저장 기술이다.

최고의 정보 저장 소재 - DNA

DNA는 사실 이미 자연에서 수백만 년 동안 정보를 저장해 온 최적의 정보 저장 소재다(그림1). 모든 생명체는 DNA에 유전 정보를 저장하고 있으며, 이 정보는 세대를 거쳐 전달되면서도 극도로 안정적으로 보존된다. DNA의 놀라운 저장 용량은 우리가 상상하는 것 이상이다. 1g의 DNA는 약 215페타바이트(PB)의 데이터를 저장할 수 있는데, 이는 현재 사용 중인 하드드라이브를 수천 개 합친 것과 맞먹는 용량이다. 또한, 이런 저장 밀도 덕분에 현재 전 세계의 모든 데이터를 단지 탁구공 5개 크기의 DNA에 저장할 수 있다. 이 정도로 뛰어난 저장 밀도는 DNA 분자의 나노미터 단위 구조 덕분이다. DNA는 길게 늘어선 4개의 염기(A·T·G·C) 조합으로 이루어져 있으며, 각각의 염기는 디지털 데이터의 0과 1처럼 정보를 담아낼 수 있다.

또한, DNA는 극한의 환경에서도 놀라운 안정성을 자랑한다. 예를 들어, 과학자들은 시베리아의 영구동토층에서 40,000년 이상 보존된 말똥가리의 DNA를 성공적으로 복구한 바 있다. 이처럼 DNA는 열, 습기, 방사선 등 다양한 환경에 노출되더라도 구조가 무너지지 않고 정보를 오랜 시간 동안 안정적으로 유지한다. 심지어 공룡이나 매머드와 같은 고대 생물의 DNA를 분석해 이들의 진화사를 연구할 수 있을 정도로 뛰어난 보존성을 가지고 있다. 이렇게 시간이 지나도 물리적인 손상이 거의 없다는 점은 에너지적인 장점으로도 이어진다. 전통적인 디지털 저장장치는 일정 주기마다 전력과 유지 관리가 필요하지만, DNA는 냉장 상태에서만 보관해도 수천 년간 데이터를 유지할 수 있다. 만약 전 세계 데이터센터들이 현재 DNA 저장 기술을 도입하게 된다면, 에너지 소비를 획기적으로 줄여 환경에 미치는 영향을 크게 감소시킬 수 있을 것이다.

▲그림 2. 인공 DNA 데이터 저장 과정
▲그림 2. 인공 DNA 데이터 저장 과정

DNA를 활용한 데이터 저장 방식

DNA에 데이터를 저장하는 과정은 다섯 단계로 나뉜다(그림2): (1) 데이터 인코딩, (2) DNA 합성, (3) DNA 보관, (4) DNA 시퀀싱, (5) 데이터 디코딩.

(1) 데이터 인코딩: 디지털 데이터를 0과 1의 이진법에서 △A(아데닌) △T(타이민) △G(구아닌) △C(사이토신) 네 염기로 이루어진 4진법으로 변환한다. 예를 들어, 00은 A, 01은 T, 10은 G, 11은 C로 변환되며, 텍스트나 이미지 등의 데이터를 이 염기서열로 변환할 수 있다.

(2) DNA 합성: 인코딩된 염기서열을 실제 DNA로 합성한다. 현재 ‘Phosphoramidites 합성법’을 이용해 염기들을 하나씩 연결하는 방식이 주로 사용되지만, 독성 물질을 사용하며 합성 길이가 제한된다는 한계가 있다.

(3) DNA 보관: 합성된 DNA는 물이나 낮은 온도에서 안정적으로 보관된다. 작은 물리적 크기에 비해 방대한 데이터를 저장할 수 있고, 에너지를 거의 소모하지 않아 기존의 데이터 저장 장치보다 효율적이다.

(4) DNA 시퀀싱: DNA 시퀀싱 기술을 이용해 DNA에 저장된 염기서열을 읽어낸다. 이 과정이 데이터 쓰기(DNA 합성)의 반대 과정이다.

(5) 데이터 디코딩: 시퀀싱으로 읽어낸 DNA 염기서열을 다시 디지털 데이터로 복원한다. 인코딩 과정의 역순으로 4진법 데이터를 0과 1로 변환해 원래의 데이터를 되찾는다.

이처럼 DNA 데이터 저장은 기존의 저장 방식과는 다르지만, 공간과 에너지 효율성이 매우 뛰어나며 장기적인 보존이 가능한 미래형 기술이다.

친환경 DNA 합성 시스템

DNA에 데이터를 저장하기 위해 가장 중요한 것은 염기서열을 합성하는 기술이다. 현재 사용되는 ‘Phosphoramidites 합성법’은 화학적 방식으로 DNA 염기서열을 연결하는 방법이다. 하지만 이 방식은 독성 물질을 사용하고, 합성할 수 있는 염기서열 길이가 제한적이라는 단점이 있다. 이런 문제를 해결하기 위해 최근에는 효소 기반 친환경 DNA 합성법이 개발되고 있다. 효소 기반 합성법은 자연에서 DNA가 합성되는 방식으로부터 영감을 얻어 독성 물질 없이 염기서열을 합성하는 방법이다. 이 방법은 환경적으로 더 안전하고 효율적이지만, 아직 병렬 합성 기술에서는 제한적이다.

이 문제를 극복하기 위해 여러 연구 기관에서는 △잉크젯 프린팅 △전기화학 전극 △광리소그래피 등을 활용한 병렬 합성 기술을 개발하고 있다. 이런 친환경 기술들이 발전하면, 실험실 환경을 벗어나 상업적으로도 DNA 합성이 가능해질 것이며 미래 데이터 저장에 큰 전환점을 맞이할 수 있을 것이다.

▲그림 3. 반도체 칩 기반 전기화학 시스템을 활용한 위치 선택적-친환경 DNA 합성 (이미지 출처: Sci. Adv. 8, eabm6815 (2022))
▲그림 3. 반도체 칩 기반 전기화학 시스템을 활용한 위치 선택적-친환경 DNA 합성 (이미지 출처: Sci. Adv. 8, eabm6815 (2022))

반도체 기반 전기화학 시스템을 활용한 DNA 병렬 합성

이런 연구 흐름 속에서, 본 연구실은 앞서 소개한 세 가지의 병렬 합성 방식 중 전기화학 전극 연구를 통해 효소 기반 DNA 합성 방식을 병렬 합성 기술로 발전시키고자 한다. 전기화학 전극 방식은 앞서 언급한 세 가지 방식 중 가장 높은 밀도의 DNA 합성이 가능한 병렬 합성 방식이다. 이름에서도 알 수 있듯이, 전기화학 반응을 활용하는 방식이다. DNA를 원하는 염기서열로 합성하기 위해서는 병렬 전극 어레이(Array)에서 우리가 원하는 위치에서만 선택적으로 합성할 수 있어야 한다. 이를 위해서는 DNA를 선택적으로 활성화할 수 있어야하기 때문에 우리 연구실은 이를 전기화학적으로 조절하는 기술을 개발하는 연구를 진행 중이다(그림3). 전기화학 반응을 특정 전극에서 국소적으로 일으켜 pH를 그 위치에서만 변화시키면, DNA가 활성화되고, 다음 순서의 염기(예시-그림3의 Cy5-ddATP)를 주입할 경우 활성화된 위치에서만 합성할 수 있다(그림3의 Cy5 형광 이미지). 이런 식으로 활성화 반응을 전기화학적으로 조절해 원하는 염기서열을 원하는 픽셀에 합성하는 것이 주요 기술이다.

본 연구실의 핵심 연구는 반도체 칩을 활용한 전기화학 시스템을 구현하는 것이다. 반도체 칩을 통해 미세한 전기화학 반응을 정밀하게 제어하고 모니터링할 수 있으며, 나노 및 마이크로 스케일의 전극들을 독립적으로 조절할 수 있어 고밀도 DNA 병렬 합성을 가능하게 한다. 이런 연구를 통해 반도체 기반 효소 DNA 데이터 저장 장치를 개발하고, 우리나라와 전 세계의 데이터 보존 문제를 해결하는 것이 본 연구의 궁극적인 목표다.