출처 : https://www.sisain.co.kr/news/articleView.html?idxno=41939


코로나19 돌연변이의 모든 것

김연희 기자 호수 661 승인 2020.05.15 14:06 


바이러스 돌연변이는 비교적 자연스러운 현상이다. 다른 생명체의 세포를 공략해야 하기 때문에 다양성을 추구할수록 생존에 유리하다. 바이러스를 이해해야 의미 있는 정보를 구별할 수 있다.


전자현미경으로 들여다본 코로나19 바이러스. ⓒ NIAID 제공



출구를 알 수 없는 팬데믹 속에서 ‘돌연변이’는 달갑지 않은 단어이다. 여전히 수수께끼 같은 이 신종 바이러스가 그새 또 모습을 바꾸었다니 많은 이들에게 불안감을 안겨준다. 적의 모습이 자꾸 바뀌면 왠지 그에 맞설 무기를 만들기도 힘들어질 것 같다. 지금까지 코로나19 바이러스에서 발견된 변이는 3000~6000여 개로 파악된다. ‘독성이 강해진 코로나19 변종이 출현’했으며 ‘백신 개발이 물거품이 될 위기’에 놓였다는 기사들이 쏟아진다. 코로나19의 돌연변이는 과연 모두 그렇게 위험한 존재일까? 전문가들의 설명을 바탕으로 코로나19 돌연변이에 대한 궁금증을 풀어보았다.


■ 돌연변이란 무엇인가?


바이러스의 구조는 단순하다. 유전물질을 단백질 껍데기가 감싸고 있는 형태이다. 코로나19 바이러스의 경우, 스파이크(돌기)가 돋아난 구형의 단백질 옷 안에 유전물질인 RNA가 들어 있다. 코로나19의 RNA는 염기(base)들이 1번부터 29903번까지 한 줄로 늘어서 있는 염기 사슬이다. 염기란 유전물질의 가장 기초적인 구성 성분으로 A(아데닌), U(우라실), G(구아닌), C(시토신) 네 종류로 나뉜다. 염기 수가 약 30억 개인 인간 DNA와 비교하면 아주 짧아 보이지만, 코로나19는 바이러스 중에서 염기 사슬이 특이할 정도로 긴 편이다. 같은 RNA 바이러스 중 하나인 에이즈 바이러스(HIV)는 염기 약 1만 개로 이루어져 있다.


코로나19 유전자를 시퀀싱(해독)한다는 말을 들어보았을 것이다. 일종의 RNA 지도를 그리는 작업이다. 각각 염기의 종류를 뜻하는 A, U, G, C 네 글자가 29903번까지 이어진다. 전 세계를 공포에 몰아넣고 있는 코로나19의 설계도라고 할 수 있다. 마치 0과 1로 이루어진 2진법의 디지털 언어가 컴퓨터의 다양한 기능을 구현하듯이 A, U, G, C 네 글자로 된 염기 약 3만 개가 모여 유전자가 되고, 이 유전자의 지시대로 왕관 모양의 코로나19가 만들어진다.


사람의 세포에 침투한 코로나19 바이러스는 증식을 하며 RNA를 끊임없이 복제한다. 3만 개의 글자를 수천 번씩 똑같이 찍어내야 하는데 이 과정에서 종종 오류가 생긴다. 글자를 잘못 베끼거나, 중간에 빼먹는 식이다. 이 경우 부모 바이러스에는 없는 변이가 자손 바이러스에 생긴다. 돌연변이가 탄생하는 것이다.


■ 코로나19 바이러스는 돌연변이의 귀재?


유전물질에는 RNA와 DNA 두 종류가 있다. 인간은 DNA를 가지고 있다. 바이러스 중에도 DNA를 유전물질로 삼는 종이 있다. 천연두의 원인이 되는 바리올라가 바로 DNA 바이러스이다.


코로나19는 RNA 바이러스라서 변이가 쉽게 발생한다는 얘기를 한 번쯤 들어보았을 것이다. 실제로 RNA는 DNA보다 돌연변이가 빈번하게 발생한다. 바이러스든 사람이든 번식을 하려면 유전물질을 복제해야 하고, 복제에는 효소가 필요하다. RNA 생명체와 DNA 생명체는 다른 종류의 효소를 가지고 있다. 각각 RdRP(RNA 의존성 RNA 중합효소)와 DdDP(DNA 의존성 DNA 중합효소)라고 부른다. 여기서 변이와 관련된 결정적인 차이가 발생한다. 프루프리딩(Proofreading)이라고 불리는 교정 기능의 유무 때문이다. DNA 중합효소(DdDP)는 유전물질을 복제하는 도중에 오류가 발생하면 이를 교정하는 기능을 가지고 있는데, RNA 중합효소(RdRP)에는 이 기능이 없다. 프루프리딩이 없는 탓에 증식 과정에서 복제 오류가 생기면 RNA 바이러스의 경우 그대로 새끼 바이러스에게 입력된다.


코로나19 바이러스에는 한 가지 반전이 숨어 있다. RNA 바이러스임에도 불구하고 교정 기능을 가지고 있다. 생물학자인 이은희 과학 칼럼니스트가 쓴 〈코로나바이러스와 소두증 지카바이러스의 습격〉 (2018, 동아엠앤비)에는 바이러스의 복제 과정을 수학 문제 푸는 학생에 빗댄 설명이 나온다. “수십억 개의 수학 문제를 풀면서 자신의 답이 맞는지 틀리는지 전혀 다시 쳐다보지 않는 학생이 인플루엔자 바이러스라면, 문제를 다 푼 뒤에 되돌아가 헷갈렸던 몇몇 문제를 골라 다시 검산해보는 학생이 코로나바이러스다. 물론 사람의 세포는 문제 전체를 정답지와 비교하면서 꼼꼼하게 틀린 답을 골라내 고치는 성실한 학생에 비유할 수 있다.” 독감을 일으키는 인플루엔자 바이러스 역시 RNA 바이러스이다. 코로나19가 가진 RNA 중합효소의 교정 기능이 DNA와 비교하면 뒤떨어지지만, 이 기능을 전혀 갖추지 못한 인플루엔자와 비교하면 훨씬 낫다는 뜻이다.


인플루엔자 바이러스와 코로나19 바이러스의 변이율 차이는 실제 통계로 확인된다(아래 〈그림 1〉 참조). 테라젠바이오는 차세대 유전체 염기서열 분석 장비를 이용해 코로나19 바이러스의 RNA를 시퀀싱하는 국내 기업이다. 이 기술을 바탕으로 코로나19 유전자의 변이를 추적하고 있다. 테라젠바이오의 김태형 수석연구원은 “코로나19도 변이가 많이 생기긴 하지만 다행히도 독감보다는 적다. 변이 발생 속도가 1.76배 정도 느리다”라고 말했다. 테라젠바이오의 분석에 따르면 코로나19 바이러스 하나가 증식을 거듭하면서 1년 동안 획득하는 변이는 26개로 추정된다. 반면 같은 기준을 적용했을 때 인플루엔자 바이러스에는 평균 46개의 변이가 발생한다. 인플루엔자는 약 8일에 한 개씩 변이를 획득하는 데 비해 코로나19는 약 14일에 하나씩 변이가 생기는 셈이다.



■ 돌연변이 때문에 백신 개발 못한다?


변이가 백신 개발에 위협적인 요인인 건 사실이다. 방패라 할 수 있는 백신을 겨우 개발했는데 바이러스가 모양을 바꾸어 새로운 공격 루트를 발굴했다면 큰 낭패이다. 모든 돌연변이가 백신 개발에 그림자를 드리우는 것은 아니다. 어떤 변이냐에 따라 다르다.



〈그림 2〉는 코로나19 바이러스의 구조도이다. 바이러스 안에 들어 있는 RNA를 쭉 펴면 〈그림 3〉이 된다. 백신과 관련해 우리가 주목할 부분은 연두색으로 표시된 S, 스파이크(Spike) 유전자이다. 앞서 말한 것처럼 유전자는 생명체에서 설계도 구실을 한다. 스파이크 유전자는 스파이크 단백질(돌기)을 만들어내는 부분이다. 인체에 들어온 코로나19 바이러스는 스파이크 단백질을 세포수용체에 결합시켜 세포에 침투한다. 사람 세포의 문을 여는 열쇠라고 할 수 있다.


백신은 바로 이 스파이크 단백질을 타깃으로 삼는다. 전체를 공격할 것 없이 스파이크 단백질만 제구실을 못하게 하면 바이러스를 제압할 수 있다. 이 스파이크 단백질에 심각한 변이가 생긴다면 백신 개발은 수포로 돌아가게 된다. 반면 그 외의 부위에서 나타나는 변이는 백신과 관련이 없다. 기다란 RNA 전체가 아니라 연두색으로 표시된 짧은 영역에서 발생하는 변이만이 백신 개발에 차질을 불러올 가능성을 가지고 있다.



〈그림 4〉는 코로나19의 RNA를 구성하는 3만여 개 염기 각각에 나타난 변이 개수를 보여준다. 지금까지 변이가 하나도 발견되지 않은 염기도 있고, 변이가 85개나 확인된 염기도 있다(5월4일 기준). 스파이크 유전자(S)를 구성하는 21563번부터 25384번까지 염기 가운데에도 변이가 제법 생겼음을 알 수 있다. 이 변이들을 보고 ‘역시 백신 개발은 물거품’이라며 좌절하기에는 이르다. 아직 중요한 얘기가 남았다.


■ ‘의미 있는 변이’와 ‘무의미한 변이’


바이러스를 의미있게 바꾸려면 변이는 다음과 같은 3단계 연쇄작용을 모두 일으켜야 한다. 유전자 변이(염기 변이)→단백질 변이→생화학적 특성 변이(기능 변화). 이는 스파이크 ‘유전자’에 생긴 변이가 반드시 스파이크 ‘단백질’의 모양이나 특성을 변화시키는 건 아니라는 뜻이다. 유전자에 있는 염기는 세 개씩 모여 단백질의 재료인 아미노산을 만든다. 아미노산들이 다시 구조를 이루어 돌기인 스파이크 단백질도 되고, 바이러스를 감싸는 막인 엔벨로프(E) 단백질도 된다.


이때 아미노산을 이루는 염기서열이 달라져도, 많은 경우 아미노산의 종류는 바뀌지 않는다. 예를 들어 유전자의 염기서열이 A C U라고 하면 이는 ‘트레오닌’이라는 아미노산으로 발현된다. 마지막 염기가 다른 글자로 변해 A C A나 A C C 또는 A C G가 되어도 동일하게 ‘트레오닌’이 된다. 유전자는 달라졌지만 실질적으로 바이러스에 아무런 변화도 없는 ‘무의미한 변이’이다. 반면 A C U 가운데 두 번째 글자인 C에 변이가 생겨 A U U가 되면 아미노산이 ‘아이소류신’으로 바뀐다. 이 경우 해당 아미노산이 구성하는 단백질의 모양과 기능이 바뀔 가능성이 있다.


〈그림 4〉에 표시된 각 변이들을 ‘무의미한 변이’와 ‘의미 있는 변이’로 구별해서 봐야 한다. 스파이크 유전자를 이루는 24904번째 염기에는 문자 C가 T로 바뀌는 변이가 발견됐다. 이는 아미노산 종류를 바꾸지 못하는 ‘무의미한 변이’이다. 22586번째 염기에서 발견된 변이는 아미노산 변화를 일으킨다. 이 자리는 본래 트레오닌을 만들었는데 그 종류가 ‘타이로신’으로 바뀌었다. 이 경우라도 곧바로 ‘의미 있는 변이’가 되는 것은 아니다. 통과해야 하는 관문이 남아 있다. 단백질은 수백 개에서 수천 개의 아미노산으로 구성된다. 스파이크 단백질도 마찬가지다. 일부 아미노산에서 변이가 발생하더라도 스파이크 단백질의 모양이나 기능을 크게 바꾸지 못한다. 설령 스파이크 단백질이 조금 변경되었다 할지라도 백신은 효력을 발휘한다.


코로나19처럼 코로나바이러스 종류에 속하는 메르스(MERS)가 한 예이다. 최초 발견 이후 메르스 바이러스에도 수많은 변이가 발생하고 누적되었지만 백신 개발은 차질 없이 진행되고 있다. 바이러스 학자인 남재환 가톨릭대 교수는 이렇게 설명했다. “하나씩 조사하다 보면 이렇게 저렇게 배제돼서 많은 경우 별것이 아닌 돌연변이가 된다. 지금까지 추이에 비춰보면 변이로 인해 코로나19 백신을 만들지 못할 위험은 낮다.”


차세대 유전체 염기서열분석 장비(아래)로 코로나19 유전자를 시퀀싱한다. ⓒ시사IN 윤무영


■ 감염력과 독성이 강한 새로운 타입의 코로나19가 나왔다?


과학계에서는 코로나19 바이러스의 타입을 나누는 연구가 한창이다. 경쟁이 과열 양상을 띠기도 한다. 코로나19 바이러스의 유전자 염기서열을 공유하는 사이트인 ‘국제 인플루엔자 데이터 공유 이니셔티브(GISAID)’에는 코로나19 타입을 분류한 연구 결과를 섣불리 공개하지 말라는 주의사항이 올라올 정도이다. 아직 타입을 나누는 기준이 정립돼 있지도 않다.


새로운 타입의 코로나19가 감염력이나 치사율 등 바이러스의 생화학적 특성까지 달라졌는지 여부는 더욱 논쟁적이다. 이런 주장을 하는 논문들은 대부분 아직 학계의 검증을 통과하기 전인 프리프린트(출판 전 논문)이다. 프리프린트가 모두 터무니없는 내용을 담고 있는 건 아니지만 코로나19 돌연변이에 대한 불안감을 지나치게 부풀리는 것도 사실이다. 김태형 수석연구원은 “근거가 전혀 없는 것은 아니지만 그렇다고 완벽하게 근거가 있는 것도 아니다”라고 말했다.


코로나19의 단백질 가운데 하나인 ORF8에 발생한 변이를 두고 벌어지는 논쟁이 대표적이다. 중국 베이징 대학 연구진은 지난 3월 코로나19의 ORF8 부위에 생긴 아미노산 변이를 기준으로 코로나19의 타입을 S 유형과 L 유형으로 나누었다. 베이징 대학 연구진은 오리지널인 S 유형보다 그 이후에 나온 L 유형이 전 세계적으로 더 많이 퍼졌다고 보고하며, 이를 근거로 돌연변이인 L 유형이 더 공격적이고 높은 전염력을 가진다고 추정했다.


이 논문은 공개된 직후부터 반론에 부딪혔다. 유전자 분석 단계에서는 감염력을 알 수 없으며, 실제 환자들을 대상으로 관찰한 임상적인 데이터가 뒷받침되어야 감염력의 변화를 증명할 수 있다는 것이다. 바이러스 학자들의 커뮤니티인 바이롤로지컬(Virological)에는 이 가설에 여러 결함이 있어 잘못된 정보를 퍼뜨릴 위험이 있으니 해당 논문을 철회해야 한다는 글이 올라왔다.


김태형 테라젠바이오 수석연구원이 코로나19 바이러스 계통도에 대해 설명하고 있다. 계통도란 일종의 코로나19 가계도이다. ⓒ시사IN 윤무영


■ 코로나19 변종이 출현했다?


지금까지 코로나19 바이러스의 변종이 나타났다는 증거는 없다. 변종은 돌연변이와 다르다. 변종이란 사스(SARS-COV)와 코로나19(SARS-COV-2)의 관계처럼 아예 다른 종으로 분화되는 것을 뜻한다. 코로나19 바이러스가 몇 가지 타입으로 나뉘었다거나, 유럽에 퍼진 코로나19가 중국과 다른 유형이라는 뉴스는 돌연변이에 관한 뉴스이지 변종에 관한 뉴스가 아니다.


전 세계 과학자들은 코로나19의 유전자 염기서열 정보를 활발하게 공유하며 변종의 출현을 감시하고 있다. GISAID는 국제적으로 감염병 바이러스의 유전자 데이터를 공유하는 사이트로 각국에서 해독한 코로나19 유전자 염기서열이 실시간으로 올라온다. 코로나19 데이터는 빠르게 늘어 5월4일 기준 1만6063개가 등록돼 있다.



‘넥스트스트레인(Nextstrain)’은 GISAID에 올라온 정보를 바탕으로 코로나19 바이러스 계통도(phylogeny)를 그리는 국제적인 바이러스 유전정보 분석 프로젝트이다. 〈그림 5〉가 바로 넥스트스트레인에서 만든 코로나19 바이러스 계통도이다(5월6일 기준). 넥스트스트레인 사이트는 공개돼 있으니 보는 법을 익히면 누구나 코로나19의 돌연변이 현황을 파악할 수 있다(아래 '상자 기사' 참조).


계통도의 가로축은 날짜이다. 오른쪽으로 갈수록 나중에 나온 바이러스라는 뜻이다. 세로축은 유전자 변이의 정도를 의미한다. 일직선상에 있는 점들은 유전자 염기서열이 동일하다고 보면 된다. 색깔은 발생 국가를 나타내는데 보라색이 발원지인 중국이다. 계통도의 맨 아래에 깔려 있는 줄이 바로 중국 우한에서 최초로 발견한 코로나19 바이러스이다. 위로 올라가면서 첫 번째 줄과 멀어질수록 초기 우한에서 발생한 코로나19 바이러스와 유전적 차이가 커진다.


계통도란 일종의 코로나19 가계도이다. 돌연변이라는 족적을 단서로 서로 다른 검체에서 채취한 바이러스의 유사도를 비교하고, 더 나아가 이 바이러스가 어디에서 왔는지를 추적한다. 트럼프 미국 대통령은 코로나19 확산 초기 중국발 여행객을 입국 금지시키는 차단 정책을 택했다. 넥스트스트레인에서 만든 계통도를 보면, 미국 내에서 상황이 가장 심각한 뉴욕에 퍼진 코로나19 바이러스는 중국이 아닌 유럽을 통해 유입된 것으로 드러났다. 한국에서 채취한 검체의 유전자 염기서열도 올라가 있지만 그 수가 34개뿐이고, 그마저도 3월 이후로는 데이터가 없다. 한국에서 발견된 코로나19의 유래를 완전히 설명하기에는 수가 적다. 34개 샘플에 한정해보자면 대부분 보라색 가지와 맞닿아 있어 중국을 통해 들어왔음을 알 수 있다.


한 줄에서 시작해 무성하게 뻗어나간 계통도를 보며 코로나19 돌연변이 규모에 깜짝 놀랄 수도 있다. 사람에게 돌연변이는 매우 희귀한 현상이기 때문이다. 하지만 바이러스 입장에서 돌연변이는 비교적 자연스러운 현상이다. 다른 생명체의 세포를 공략해야 하는 바이러스는 한 번에 자손 바이러스 수십만 개로 증식하면서 다양성을 추구해야 생존에 유리하다. 이러한 바이러스의 처지를 이해해야 앞으로도 계속될 코로나19 돌연변이 뉴스 가운데 의미 있는 정보를 구별할 수 있다.


질병관리본부(질본)는 국내 코로나19 바이러스 유전자의 변이를 지속적으로 모니터링하고 있다. 질본은 국내 환자에게서 얻은 코로나19 샘플 73건의 유전자 염기서열을 분석한 결과 “바이러스의 전파력과 병원성에 영향을 미치는 의미 있는 유전자 변이는 발견되지 않았다”라고 4월9일 발표했다. 질본에서 분석한 유전자 염기서열 정보들 역시 순차적으로 GISAID에 올라간다.


코로나19 돌연변이 야, 나두 볼 수 있어


ⓒAP Photo


넥스트스트레인 사이트는 누구에게나 열려 있다(nextstrain.org). 계통도뿐만 아니라 분석에 쓰인 4459개 샘플의 대략적인 정보도 확인할 수 있다. 이 가운데 인간으로부터 채취하지 않은 샘플이 두 개 있다. 사육사로부터 감염된 미국 뉴욕 동물원의 호랑이(사진)와 네덜란드 밍크 농장의 밍크이다. 두 동물에서 확보한 코로나19 바이러스의 유전자 염기서열을 분석한 결과 사람과 다른 특이적인 변이는 확인되지 않았다. 궁금하다면 ‘Host’ 난에 학명인 Panthera Tigris(호랑이), Mustela lutreola(유럽밍크)라고 적힌 샘플을 찾으면 된다. 일주일에 한 번씩 코로나19의 전파와 관련해 상황 보고서가 업데이트되는데 한국어 버전도 있다. 일반인들을 위해 ‘계통수를 읽는 법’ 등도 안내한다.


국내 사이트인 국가생명연구자원정보센터(KOBIC)에서도 코로나19 연구정보 포털을 만들어 유전변이 현황을 전하고 있다(kobic.re.kr/covid19). 위 본문 기사의 〈그림 4〉가 KOBIC에서 만든 자료이다. 코로나19의 3만 개 염기별 변이 발생 여부와 빈도를 확인할 수 있다. Mutation Annotation(돌연변이 주석)이라는 타이틀 아래 코로나19 유전자에 발생한 변이 종류를 정리한 그래프도 제공한다.



Posted by civ2
,