베이커 선생은 지구 정복이 꿈인가 보다. 이제 심지어 바이러스의 프로토타입을 만드는 데까지 성공! 짤막하게 초록을 번역하고 조립체가 어떻게 조립되는지 보여주는 그림 1B를 첨부한다.


스스로의 RNA 유전체를 포함할 수 있는 설계된 단백질 조립체의 진화

https://doi.org/10.1038/nature25157


초록

복잡한 생화학 환경 속에서 진화하기 위해 겪는 어려움으로는 유전자형과 표현형을 연결하는 문제와 유전 물질을 보호하는 문제가 있는데, 생체 시스템들은 핵산을 단단히 포장함으로써 이 문제들을 우아하게 풀어낸다. 가장 간단한 예로서, 바이러스는 껍질 단백질(capsid)로 자신들의 유전체를 싼다. 비록 자연에 존재하는 이러한 시스템을 변형하여 친화성(tropism)을 바꾸거나 특정 단백질 및 펩타이드를 만들게 하는 연구들이 진행되기는 했으나, 모듈성을 포기하고 효율성을 추구해 온 수십억 년의 진화로 인해 바이러스 껍질 단백질을 고친다는 것은 쉽지 않다. 바이러스에서 기인하지 않은 단백질로 만들어진 합성 시스템은, 바이러스와 연관된 안전상의 위험 및 조작의 어려움을 피하는 한편, 약물 전달 및 다른 생체의학 응용 분야에 필요한 성질을 진화시키는 '빈 서판'을 제공할 수 있다. 이 연구에서 우리는 20면체 단백질 조립체이자 내부 막이 양전하를 띠어 자신의 전체 mRNA 유전체를 포장할 수 있는 핵 껍질 단백질(nucleocapsid)을 계산으로 설계하고 합성하였다. 우리는 이 핵 껍질 단백질이 바이러스와 유사한 성질을 진화로 얻을 수 있는지 확인하기 위해 대장균을 발현 숙주로 삼아 다양한 개체군을 만들었다. 몇 세대 진화를 시키자, 유전체 포장 효율(133배 이상), 혈액 속의 안정성(주사 후 6시간 뒤에 포장된 RNA가 살아남은 비율이 3.7% 미만에서 71%로), 체내(in vivo) 순환 시간(5분 미만에서 약 4.5 시간으로)이 눈에 띄게 향상되었다. 진화의 결과로 만들어진 합성 핵 껍질 단백질은 11개의 20면체 조립체 당 하나 꼴로 전체 RNA 유전체를 포함하는데, 이 비율은 재조합 아데노 부속 바이러스(adeno-associated virus) 벡터의 최고 기록과 유사하다. 이 결과는 단백질 조립체가 바이러스와 유사한 유전체 포장 및 보호 능력을 획득할 수 있는 단순한 진화 경로가 존재함을 보여준다. 그간 약물 전달 및 백신에의 응용을 위해 더 안전하고 효율적으로 바이러스를 조작하기 위한 '하향성' 접근법에 많은 노력을 들여 왔지만, 계산을 통해 합성 나노물질을 설계하고 진화를 통해 그들을 최적화할 수 있는 기법의 개발로 이제 프로그램성과 조작성에 많은 장점이 있는, 이에 보완적인 '상향성' 접근법이 가능해졌다.


내가 너무 <이라이프>를 편애하는 것 아닌가 싶지만, 그래도 이 논문은 소개해야겠어서 또 <이라이프> 논문을 들고 왔다. (게다가 이 논문 저자 중에 내 사형(師兄)이 포함되어 있다 ㅋㅋ) 아래에 초록과 요약문을 번역한다.

숙주의 단백질 항상성이 독감 진화를 조절한다

초록
RNA 바이러스 진화를 예측하고 조절하려면 이 병원체에 접근할 수 있는 변이 판도(mutational landscape)를 규정하는 분자 요소들을 이해할 필요가 있다. RNA 바이러스는 대개 변이 속도가 빠르기에, 환경의 변화에 대응할 수 있는 생물리 성질을 갖는 단백질 변이들을 빠르게 만들어낼 수 있다. 이에 따라 단백질 접힘과 기능에 위협이 가해지고, 이 위협에 의해 바이러스의 진화가 제한된다. 우리는 숙주의 단백질 항상성 유지 메커니즘이 바이러스 단백질 변이체들의 적응도에 대한 주요 결정 인자로서 바이러스 진화의 방향을 결정하는 핵심적인 힘이 될 수 있다는 가설을 제안한다. 여기서 우리는 이 가설을 시험하기 위해 화학적으로 통제된, 다양한 단백질 항상성 환경을 가진 숙주 세포 안에서 독감 바이러스를 증식시켰다. 우리는 독감 바이러스의 유전체에 작용하는 선택압의 본성과 특정 변이 궤적의 접근 가능성이 모두 숙주의 단백질 항상성에 의해 유의미한 영향을 받았음을 알아냈다. 이 발견으로 바이러스 진화를 결정하는 숙주-병원체 상호작용의 특징을 더 깊이 이해할 수 있으며, 숙주의 단백질 항상성을 조절함으로써 바이러스가 저항성을 획득하기 어려운 항바이러스 치료법을 개발하는 데에도 통찰력을 얻을 수 있다.

요약
독감 바이러스는 우리의 면역계에 침입하여 스스로를 끊임없이 변화시킴으로써 치료에 대한 저항성을 키운다. 특별히, 그들의 유전체에 발생하는 변이들로 인해 독감 바이러스 단백질들이 변형되어 바이러스가 우리 몸의 방어 체계를 공격할 수 있게 된다. 하지만, 이들 변이들은 공짜가 아니고, 바이러스 단백질들이 기능을 수행할 수 있는 안정한 3차원 구조를 만드는 과정("단백질 접힘"이라 불린다)을 방해하여 바이러스가 증식하는 것을 막을 수도 있다.

인간 세포 안에는 샤페론(chaperone)이라 불리는 단백질들이 존재해 우리의 다른 단백질들이 올바로 접힐 수 있도록 도와줄 수 있다. 독감 바이러스들은 스스로 샤페론을 가지고 있지 않기에, 대신 숙주의 샤페론을 훔쳐서 사용한다. 따라서 숙주의 샤페론들은 바이러스의 증식 능력에 핵심적인 역할을 한다. 그러나, 지금까지 숙주 샤페론들이 바이러스의 진화에 어떻게 영향을 미치는지에 대해 알려진 바가 없었다.

이 논문에서 Phillips et al.은 포유류 세포를 이용해 숙주 샤페론들이 어떻게 진화하는 독감 바이러스 군집에 영향을 미치는지 연구했다. 이들은 먼저 세포들을 조작하여 각각 정상 샤페론 수치, 높은 샤페론 수치, 혹은 비활성 샤페론을 가진 세포들을 만들어냈다. 다음으로 H3N2 독감 바이러스를 약 200 세대에 걸쳐 이들 다른 조건에서 키운 후, 유전자 서열을 뽑아내 이 바이러스가 각 특징적인 숙주 샤페론 환경에서 어떻게 진화했는지 조사했다.

Phillips et al.은 숙주 샤페론들이 독감 바이러스 군집에서 변이가 누적되는 속도 및 독감 유전체에 누적되는 변이의 종류에 영향을 미친다는 것을 발견했다. 예를 들어, Hsp90이라 불리는 샤페론이 비활성화되었을 경우, 바이러스 군집에서 변이들이 기존 유전자를 대체하는 속도는 정상 혹은 높은 샤페론 수치를 가진 세포들에 비해 훨씬 느렸다. 게다가, 일부 특정 변이들은 높은 샤페론 수치의 세포들에서 더 번성했지만, 다른 변이들은 샤페론이 비활성화된 세포에서 더 번성했다.

이 결과는 독감의 진화가 숙주 샤페론 수치에 의해 복잡하고 중요한 방식으로 영향 받음을 보여준다. 게다가, 샤페론이 어떤 단일 변이의 효과를 향상시키는지 방해하는지는 미리 예측하기 힘들다. 이 발견은 매우 중요한데, 이는 독감 바이러스가 사용할 수 있는 샤페론은 조직에 따라, 개체에 따라, 감염 조건에 따라 달라질 수 있기에, 바이러스가 스스로를 변형하고 진화하는 능력은 샤페론의 맥락에 따라 다르게 영향 받을 수 있기 때문이다.

이 발견은 같은 목적으로 숙주 샤페론을 훔쳐 쓰는 HIV나 에볼라 바이러스와 같은 다른 바이러스로 확장될 수 있을 것으로 보인다. 특정 샤페론이 바이러스의 적응 능력에 어떤 영향을 미치는지, 특히 발열이나 바이러스의 숙주 전환 등과 같이 병리적으로 유의미한 조건에서 어떤 영향을 미치는지 좀 더 정확히 예측하기 위해서는 체계적으로 이러한 효과를 정량화해야 할 것이고, 더 많은 연구가 필요할 것이다. 장차 이러한 통찰력이 바이러스가 저항성을 진화시킬 수 없는 치료법을 개발하는 데 도움을 줄 것이다.
이번 주 <사이언스>에 실린 단백질 연구 소개글. 단백질 품질 관리(protein quality control; PQC)라고 하면 세포 내에서 정상적인 단백질의 양을 일정하게 유지하기 위해 생성 과정과 파괴 과정을 조절하는 것을 말하는데, 당연히 다양한 요소가 그 조절 과정에 참여한다. 그 중 특별한 녀석을 찾아낸 모양이다.

단백질 품질 관리의 새로운 진보

세포의 단백질체는 단백질 항상성(proteostasis)으로 알려진 단백질 합성과 분해 사이의 동적 평형에 의해 유지된다. 단백질 항상성을 성공적으로 유지하기 위해서는 품질 관리 경로(quality control pathway)를 통해 잘못 접힌 단백질을 찾아서 제거하는 것이 반드시 필요하다. 전사 오류, 접힘 오류, 나이가 들어서 생기는 손상, 화학적 손상에서 발생하는 단백질들과 고아 단백질들(여러 단백질로 구성된 복합체에서 구성요소 간의 비율이 맞지 않아서 생기는 단백질들)은 전부 세포에 쌓여 독성을 띠지 않도록 여러 분해 경로의 목표가 된다[1]. 분해를 통한 품질 관리의 놀라운 성질 중 하나는 각 경로가 매우 넓은 범위의 반응물을 다룰 수 있는 동시에 정상 단백질의 잘못 접힌 버전들을 정확히 찾을 수 있다는 것이다. 이번 호의 472쪽과 471쪽에서, 각각 Yanagitani et al.[2]과 Nguyen et al.[3]은 새로 발견된 품질 관리 경로가, 상대적으로 "세포 상태의" 그물 적혈구가 고도로 전문화된 헤모글로빈 풍부 적혈구로 분화되는 과정[4, 5]에서 관찰되는 단백질체 구성의 전면적인 변경을 일으키는 데 사용된다는 것을 보인다.

그림: 고아 단백질을 분해하기


Nguyen et al.은 그물 적혈구(적혈구의 전구체)의 분화 과정에서 일어나는 극적인 분해 리모델링의 기저에 있는 메커니즘을 해독하고자 했다[3]. 이 리모델링 과정 중에 리보좀 및 다양한 그물 적혈구 단백질이 사라지는데, 그럼으로써 산소를 나르는 데 최적화된, 고도로 전문화되고 단순화된 단백질체(98%가 헤모글로빈으로 이루어짐)가 만들어진다. 이 연구진의 시작점은 UBE2O에 해당하는 유전자의 상염색체 열성 대립 유전자를 찾아내는 것이었는데, 이 열성 대립 유전자는 쥐에서 빈혈을 일으킨다. UBE2O는 보통 목표 단백질에 유비퀴틴을 붙이는 일을 수행하는 E2 유비퀴틴 접합 효소로, 흥미롭게도 적혈구 분화 과정에서 과발현된다. UBE2O를 발현하지 않는 그물 적혈구(ube2O-/-)를 사용하여, 이들은 (헤모글로빈의 구성 요소인) 고아 α 글로빈이 프로테아좀에 의해 분해될 수 있도록 UBE2O가 고아 α 글로빈에 여러 개의 단분자 유비퀴틸기를 붙인다는 것을 찾아냈다.

이 연구진은 또한 리보좀 단백질(여러 개의 리보좀 단백질이 모여 단백질을 만들어내는 리보좀 복합체를 형성한다)이 UBE2O의 주된 반응물임을 알아냈다. 야생형과 ube2O-/- 그물 적혈구의 체외(ex vivo) 배양액으로부터, (그물 적혈구가 분화되어 적혈구를 만드는 과정의 후반부를 특징 짓는) 리보좀의 소멸은 UBE2O와 프로테아좀 둘 다의 활동 때문임이 밝혀졌다. 따라서 UBE2O의 이러한 활동의 결과, 그물 적혈구 안에 이미 존재하는 단백질들은 분해되고, 적혈구에서 관찰되는 바 (리보좀에 의해 매개되는) 단백질 형성은 하향조절된다. 게다가, UBE2O의 과발현만으로도 적혈구가 아닌 세포들에서 리보좀 분해가 일어난다. 시험관(in vitro) 생화학 데이터는 UBE2O가 반응물 인식 능력이 있음을 지지하는데, 이 능력은 대개 E3 유비퀴틴 연결 효소가 보이는 것이다. 이 연구는 이 효소 하나가 다양한 단백질의 파괴 과정에서 갖는 중요성을 명백하게 보였으며, UBE2O이 다양한 반응물을 정확하게 인식하는 능력은 품질 관리 경로 또한 보이는 특성이다.

UBE2O와 품질 관리 사이의 관련성은 Yanagitani et al.에 의해 수립되었다. 이러한 경로들 너머의 메커니즘을 이해하려는 노력의 일환으로, 연구진은 세 개의 아르지닌 잔기가 삽입된 막 투과 단백질(transmembrane protein)에 해당하는 인공 기질에 유비퀴틸기가 부착되었는지 확인하는 무세포 검사법(cell-free assay)을 개발했다. 이 기질은 이전에 알려진 많은 품질 관리 분자 기계 중 어느 것에도 반응하지 않았다. 그 대신, UBE2O가 (E1 효소, 유비퀴틴, ATP가 있는 환경에서) 이 인공 기질 뿐 아니라 다른 잘못 접힌 단백질들을 인식하고 유비퀴틸기를 부착하는 필수충분조건임이 밝혀졌다. 이 놀라운 E2 유비퀴틴 접합 효소는 또한 특이성을 불러오는 E3 연결 효소인 것 같았다. 후속 시험관 연구에서 UBE2O의 보존된 도메인들이 단백질의 소수성 영역을 인식하는 넓은 범위의 능력을 가지고 있고, 그 결과 이곳에 여러 개의 단분자 유비퀴틴이 부착된다는 것이 밝혀졌다. Nguyen et al.과 마찬가지로, 이들은 UBE2O이 고아 α 글로빈에 유비퀴틴을 부착한다는 것을 찾아냈다. 이들은 또한 새로 만들어진 리보좀 단백질들이 핵으로 수송되어 리보좀 구성요소에 포함되지 않는다면, 분해될 수 있도록 UBE2O에 의해 인식되어 유비퀴틴이 부착된다는 것을 알아냈다.

이 두 가지 연구는 모두 UBE2O가 자체적으로 많은 종류의 반응물에 유비퀴틴을 부착하여 프로테아좀이 그들을 분해할 수 있게 할 수 있는 독보적인 E2 효소임을 보였다. UBE2O에 의해 매개되는 여러 단분자 유비퀴틴화 과정의 대상 단백질들에서 공통적으로 발견되는 "신호"는 염기성과 소수성 아미노산들이 연속해서 존재하는 서열로, 고아 단백질 요소가 자주 보이는 노출된 결합 표면에 많이 나타난다. 흥미롭게도, 이러한 고아 단백질들은 만들어진 초기 몇 시간은 불안정하나 시간이 지남에 따라 안정화된다[6]. 이 관점에서 볼 때, UBE2O는, E2 유비퀴틴 접합 효소와의 분명한 상동성에도 불구하고, 그 대상을 찾는데 어댑터나 샤페론 단백질 없이 기능할 수 있는 품질 관리 유비퀴틴 E3 연결 효소의 일종에 속한다[7]. 사실, UBE2O의 생리적 혹은 인위적 과발현은 방대한 단백질체 리모델링을 일으킨다. 이러한 성질이 다른 품질 관리 요소들과 공유되는지, 그리고 품질 관리가 단백질체 리모델링과 분화 경로에서 보다 일반적으로 사용되는지와 같은 질문들은 미래의 연구가 나아갈 중요한 길이다.

UBE2O와 다른 품질 관리 경로들의 더 깊은 이해는 세포의 건강을 향상시키도록 단백질체를 변형하는 새 치료법을 개발하는 데 도움을 줄 것이다. 혈액 질환인 β 지중해 빈혈(헤모글로빈 발현이 감소)에서 관찰되는 α 글로빈 응집체를 제거하는 것이 한 가지 예이다. 세포가 이러한 경로들을 변경하는 법을 배우고, 우리가 같은 일을 할 수 있는 방법을 찾아내는 것은 기초의학 및 중개의학의 놀라운 잠재력을 가지고 있다[8, 9].
박사 때 바이러스 연구에 손을 잠시 담가서 그런지, 바이러스에 대해서는 꾸준히 관심이 있다. 특히 인플루엔자는 (나름 논문도 한 편 있는데) 아는 게 하나도 없어서 =_= 기회가 될 때마다 관련 논문을 살펴 본다. 이번에 <구조생물학의 동향>에 관련 논문이 올라와서 초록과 서론을 번역한다.

인플루엔자 A 특이성에 관한 통찰: 패러다임의 진화

초록
인플루엔자 수용체가 갖고 있는 특이성을 분자 레벨에서 이해하는 것은 쉽지 않은 일인데, 이는 결합 세기를 정량적으로 측정한 데이터가 적기 때문이기도 하지만 글라이칸 배열칩 데이터가 애초에 정성적이고 가변적이기 때문이기도 하다. 게다가 바이러스의 글라이코실화 과정이 미치는 다양한 영향과, 글라이칸 배열칩에 올릴 수 있는 생물학적으로 의미있는 수용체의 범위가 상대적으로 좁다는 것 또한 연구의 장애물이 된다. 이 글에서는 수용체의 구조적 성질을 연구한 결과를 소개하며, 결론으로서 구조 엔트로피가 특이성을 정의하는 데 중요한 역할을 한다는 점을 밝히고자 한다. 한 가지 최근에 보고된 예로써, Siaα2-6Gal 서열로 끝나며, 헤마글루티닌 삼분자체(hemagglutinin trimer)의 결합 부위 두 군데와 두 자리 상호작용(bidentate interaction)을 형성하는 이중 안테나 구조의 수용체들의 능력이 그렇다. 두 자리 상호작용으로부터 Siaα2-6 수용체가 인간 전염성 바이러스의 헤마글루티닌과 결합했을 때 열린 우산 구조를 갖는다는 관찰 결과를 설명할 수 있으며, 이 관점으로부터 바이러스의 결합 능력과 세포 조직에 대한 친화성을 다시 검토해 볼 필요가 있다.

서론
야생 새들은 인플루엔자 A 바이러스의 1차적인 자연 상태 저장소이며[1], 5천만 명 가량을 죽인 1918년 스페인 독감 대유행[2]은 조류 독감 바이러스가 자발적 변이로 인간-인간 전염성을 획득한 결과라고 여겨지고 있다[3, 4]. 동물 매개 감염 독감이 인간을 감염시킬 수 있는 것은 사실이나[5], 이 경우 감염된 동물과 직접 접촉해야만 한다[6]. 대유행을 불러오는 그 다음 특성인 인간-인간 전염성은 바이러스가 추가로 유전적 변이를 획득해야만 얻을 수 있다[5, 6]. Reperant et al. [5]에서 언급한 바와 같이, 동물 매개 감염 바이러스가 인간을 감염시킬 수 있으려면 세 가지의 장애물을 뛰어넘어야 하는데, 동물-인간 전염성, 바이러스-세포 상호작용, 그리고 인간-인간 전염성이 그들이다. 주기적으로 찾아오는 독감 유행은, 인간-인간 전염성을 획득했으며, 충분한 변이를 거쳐서 인간 개체군 내에 이미 존재하는 면역 시스템을 피할 수 있을 만한 바이러스 계통들이 서로 돌아가며 일으킨다[7].

스페인 독감과는 대조적으로, 2009년의 조류 독감 대유행은 상대적으로 가볍게 지나갔다[8]. 그럼에도 불구하고, 그 독감이 퍼져나가는 빠른 속도로 인해 세계 보건 기구(WHO; World Health Organization)의 우려를 불러일으켰다[9]. 첫 사례가 발생한지 6주 안에 조류 독감은 70개 이상의 나라로 퍼져 나갔고[10], 새로운 백신이 개발될 필요가 있었다. H5N1과 같은 고병원성 조류 인플루엔자(HPAI; highly pathogenic avian influenza)의 경우, 인간 적응 문제가 특별한 우려점이었다. 비록 자주 일어나지는 않았지만, 조류 H5N1에 감염된 인간의 사례가 16개국에서 보고되었으며, 약 60%의 사망률을 보였던 것이다[11]. 따라서 대유행에 준비하기 위해서는 새로 발생하는 바이러스 계통들의 발병력을 예측해야 하고, 이를 위해서는 인플루엔자 특이성의 기본 원리를 깊이 이해할 필요가 있다. 여기서, 우리는 숙주의 글라이칸 구조와 인플루엔자 특이성의 관계를 글라이칸의 세부 구조와 동역학의 핵심적인 역할을 찾아낸 최근 데이터에 비추어 다시 검토하고자 한다.

인플루엔자 A의 분류는 헤마글루티닌(HA; hemagglutinin)과 뉴라미니데이즈(NA; neuraminidase) 껍질 단백질의 항원 특성에 기반을 두고 있다. 인플루엔자 HA는 동형 삼분자체 당단백질로, 이를 이루고 있는 단위 분자들은 각각 구형의 머리 부분(HA1)과 줄기 부분(HA2)을 가지고 있다[12]. 각 HA1 부분은 수용체 결합 부위(RBS; receptor binding site)을 가지고 있는데, 바이러스는 숙주 세포에 달라붙을 때 이 부위를 시알산(sialic acid)을 포함하고 있는 숙주의 글라이칸과 결합시킨다. 열여덟 가지 세부 종류의 헤마글루티닌이 존재하며, 그들은 항원 특성에 따라 두 그룹으로 분류된다. 1번 그룹은 H1-2, H5-6, H8-H9, H11-13, H16으로 구성되고, 2번 그룹은 H3-4, H7, H10, H14-15로 구성된다. 가장 많이 연구된 HA는 H1, H3, H5이다[13, 14]. NA 단백질은 세포가 감염된 후 시알산을 숙주의 수용체 글라이칸으로부터 분리시키는 역할을 하는데, 이로써 자손 바이러스들이 숙주 세포의 표면으로부터 탈출할 수 있다[15]. 저온전자현미경 단층 촬영으로부터 단백질 껍질에 약 300개의 HA 단백질이 존재함을 알았고[16], HA와 NA의 비율은 바이러스 계통에 따라 4:1에서 6:1까지 달라진다[16, 17]. 특정 독감 계통이 인간을 감염시키는 능력에 영향을 미치는 요소는 복합적인데, 예를 들어 노출 정도, 새로 감염된 개체가 스스로 복제하는 속도, 글라이칸이 바이러스 표면 HA에 달라붙는 정도, 바이러스 표면 NA의 활동도 등이 있다[15, 18, 19, 20, 21, 22, 23]. 게다가, NA의 효소 활동도는 HA의 결합 세기와 균형을 이루어야 한다[15, 22]. 만약 NA가 HA의 결합 세기에 비해 지나치게 활동적이면, 바이러스가 숙주 세포를 감염시키는 능력을 감소시키게 된다. 반대로, NA가 상대적으로 약하면 자손 바이러스들이 떨어져 나가기 힘들어진다.

수용체의 특이성에 더하여 동물 매개 감염에 영향을 끼치는 요소로는, pH로 매개되는 엔도솜 융합에 대한 HA의 감도 차이[24]와 바이러스의 라이보핵단백질 복합체가 숙주의 핵으로 옮겨지는 과정(숙주 적응)의 효율 차이[25]가 있다. 게다가 전염과 복제의 용이성은 숙주 조직 수용체들의 분포와 구성에도 의존하는 것처럼 보인다. 바이러스 부착 연구에 따르면 인간 독감 바이러스들은 조류 바이러스에 비해 인간의 기도와 기관지에 더 강하게 달라붙으며, 다양한 종류의 세포에 결합한다[26]. 따라서, 적절한 수용체가 없다는 것이 인간 내에서 조류 바이러스가 전염되고[27] 복제되는[28, 29] 효율이 좋지 않은 이유로 여겨진다. 세포 조직에 대한 이러한 친화성의 분자적 기초를 밝혀내기 위해 많은 연구가 수행되었다[28, 30, 31, 32].


<구조생물학의 동향(Current Opinions in Structural Biology)>은 구조생물학의 최근 연구 동향에 대해 여러 리뷰를 수록하는 저널인데, 2017년 10월호를 저온전자현미경(cryo-EM)에 관한 특집호로 꾸미는 모양이다. 그 중 몇 편의 논문이 벌써 온라인에 올라왔는데, 하나를 골라 초록과 서론을 번역한다. 요새 핫한 분야다 보니 개략적인 내용만 아는 것도 도움이 될 듯.

고해상도 저온전자현미경: 볼트와 너트

초록
저온전자현미경과 단일입자분석 덕분에 이제 X선 결정학이나 다른 접근법으로 밝힐 수 없는 거대분자 복합체의 고해상도 구조를 결정할 수 있게 되었다. 저온전자현미경으로 고해상도 구조를 성공적으로 결정하는 데에는 항상 단백질 시료의 질이 중요하다. 구조적 불균일성이 저온전자현미경의 중요한 과제로 남아 있지만, 동시에 거대분자 복합체의 내재적 구조 유연성을 연구할 드문 기회가 되기도 한다. 여기서 우리는 이 '해상도 혁명'을 가능하게 한 몇 가지 중요한 기술적 발전을 살펴보고 고해상도 구조 결정을 위해 뛰어넘어야 하는 기술적 장벽들을 간결하게 보여주고자 한다.

서론
저온전자현미경(cryo-EM; cryogenic transmission electron microscopy)과 단일입자분석(SPEM; single-particle analysis)은 혁명 중에 있다. 최근의 많은 연구들에 따르면 SPEM은 X선 결정학이나 다른 접근법으로 밝힐 수 없는 분자들의 고해상도(4 Å 미만) 모형을 만드는 데 사용될 수 있다. 이 급속한 발전이 가능케 한 주요 기술적 발전들로는 시료 제작 및 안정화 기법, 극도로 안정한 전자 현미경, 점차 감도가 좋아지는 직접 전자 검출기, 이미지 처리 소프트웨어의 향상 등이 있다. 이제 구조생물학의 가장 어려운 목표들조차 저온전자현미경을 통해 거의 원자 수준의 해상도로 그 구조가 결정될 수 있다. 일례로, 고정되지 않은 구성과 구조를 가진 큰 거대분자기계들과, 작은 분자량(300 kDa 미만)으로 인해 이전에는 저온전자현미경 기법을 적용할 수 없다고 여겨진 단백질 복합체들이 있다. 2016년 11월 기준, 전자현미경 데이터 은행(EMDB; Electron Microscopy Data Bank)에 저장된 전자현미경 지도 4231개 중 620개 5 Å 미만의 해상도를 가지고 있다. 2016년 1월 이후 저온전자현미경 기법의 모든 면에 걸쳐 40개 이상의 리뷰가 출판되었다. 여기서 우리는 SPEM으로 고해상도 구조를 결정하기 위하여 넘어야 하는 기술적 장벽들을 간결하게 정리하고 각 단계의 세부 사항에 대해서는 더 읽어볼 문헌들을 알려주고자 한다.


지도교수님이 필자 중 한 명으로 참여한 <네이처 화학생물학(Nature Chemical Biology)> 논평. 이건 우리 분야니까 논문을 전부 다 번역해 본다. 분류를 어떻게 할까 하다가, 단백질 과학은 물리학-화학-생물학 모두를 포괄하는 킹왕짱이니까 내 맘대로 따로 분류를 만들었다 -_-v

단백질 내의 질서와 무질서 동시에 측정하기

초록
핵자기공명 분광학(NMR; nuclear magnetic resonance)은 단백질의 구조와 움직임이 얼마나 서로 긴밀하게 연결되어 해당 단백질의 기능과 상호작용의 기초가 되는지를 밝혀냄으로써 단백질을 바라보는 우리의 관점을 변화시키고 있다. 단백질을 통계적 모음으로 보는 관점은 구조적으로 불균일한 상태들의 존재 및 생물학적 가치를 드러내고 있고, 그 결과 질서와 무질서 사이의 이분법을 넘어 그 사이의 연속성을 더 정량적으로 묘사할 수 있도록 해준다.

서론
무질서한 단백질(disordered protein)은 인간 단백질체의 1/3을 구성하고 있고, 유전자 조절과 신호 전달에 중요한 역할을 한다고 알려져 있다. 무질서한 단백질이 발견되기 전까지 단백질은 각 원자들의 좌표가 거의 정확하게 정의될 수 있는, 잘 정의된 자연 상태 구조로 접힌다는 생각이 과학계를 지배하고 있었지만, 무질서한 단백질의 발견으로 이 오래된 패러다임이 크게 흔들렸다. 이 발견 이후 '질서'와 '무질서'라는 용어가 대비되어 사용되었는데, 돌이켜 생각해보면 단백질의 움직임을 완벽하게 알아낼 수 있는 기술이 없다는 것이 그 양극화의 주된 원인이었다. 단백질의 무질서는 초기에는 '구조의 부재'로 정의되었는데, 이는 예를 들어 X선 결정학으로 결정된 자연 상태 구조에서 좌표값이 결정되지 않은 구역들과 같은 개념이었다. 이러한 정의에 따르면 질서와 무질서는 상호 배타적이어야 하나, 실제로 단백질의 구조와 움직임은 서로 밀접하게 연관되어 이 분자들의 기능에 중요한 역할을 수행하기에 두 개념이 꼭 상호 배타적이라고 볼 수는 없다.

이 논평에서, 우리는 이 인위적인 질서-무질서 이분법을 점차 대체할 수 있도록 단백질의 구조와 움직임을 동시에 결정할 수 있는 방법론들, 구체적인 예로는 핵자기공명(NMR) 분광학 기법들이 개발되어 온 역사를 논의한다. 우리는 이와 같이 구조와 움직임에 관한 더 정량적인 묘사들을 소개함으로써 단백질 거동에 내재되어 있는 분자 메커니즘에 관한 강력한 통찰력을 제공하게 되리라 기대한다.

질서-무질서 연속체
단백질의 자연 상태는 완전히 질서 있는 상태로부터 거의 완전히 무질서한 상태에 이르기까지, 그 중간 단계들까지 다 포함하여 존재할 수 있다는 것이 점차 증명되고 있다(그림 1). 허나 구조 데이터로부터 그 기능을 해석해 낸다는 것은 쉽지 않다는 것이 점차 일반적으로 받아들여지고 있는데, 이는 대부분의 현대 실험 방법론들은 단백질의 움직임을 아직 잘 기술하지 못하기 때문에 용액 속에서 존재 가능한 통계적 모음 안에서 가장 대표적인 '정적' 구조만 찾아내기 때문이다. 한편, 속도론적 단백질 결정학과 통합 구조 생물학(구조 결정에 사용되는, 다양한 상호보완적인 방법론들을 결합하는 접근법)의 발전으로 인해, 피코초에서 나노초 정도의 시간 수준에서 수집된 상태들을 원자 수준의 해상도로 기술할 수 있게 되었다(보충설명 1). 이러한 접근법들로부터, 저온에서 단단히 뭉친 결정 구조로 존재하는 많은 단백질들이 실제로는 매우 동적이며, 특히 기능, 상호작용, 다른 자리 입체성 조절(allosteric regulation)에 중요한 부분일수록 그렇다는 것이 증명되었다. 게다가, 무질서 단백질에서 주로 나타나는, 더 큰 규모로 더 긴 시간 동안 일어나는 움직임을 정확히 묘사할 수 있는 기술들에 대한 필요가 점차 증가하고 있다(보충설명 1). 이 방향으로 진보가 일어날수록, 단백질의 질서와 무질서 사이의 이분법은 점차 이 두 극단 중간의 다양한 상황들에 관한 정량적인 묘사로 대체될 것이다.

[그림 1] 단백질의 구조와 움직임은 구조의 통계적 모음을 통해 효과적으로 기술된다.

(a) 메타추론 방법론으로 계산된 인간 프리온 단백질 구조의 통계적 모음. (b) δ2D 방법으로 계산된 NMR 화학적 이동으로부터 결정된, 이에 대응하는 2차 구조 분포(BMRB ID 4402). (c) PODD 데이터 집합에 있는 모든 잔기에 대한 α 나선과 β 가닥 분포의 산포도. 점선 사각형은 한 가지 이상의 2차 구조를 갖는 불균일한 영역의 잔기들을 표시한다. (d) 무질서 여부를 예측하는데 흔히 사용되는 서열 정보 기반 방법론들(x축)의 균형 정확도(balanced accuracy)를 나타낸 막대 그래프. 사용된 데이터는 생리적 조건 하의 단분자 단백질들에서 측정된 화학적 이동에 대응하는 PODD 데이터 집합의 일부이다. 이 패널에서 단백질의 각 영역은, 만약 최소한 L개의 연속한 잔기(범례와 같이 L = 1, 10, 20, 30)의 α 나선과 β 가닥 분율이 모두 0.5보다 작다면 무질서한 것으로 정의되고, 그 외에는 질서 있는 영역으로 정의된다. s2D 방법론의 막대는 회색으로 표시되었는데, 이는 데이터 집합의 일부 서열이 훈련 집합(training set)에서 사용되었기 때문이다.

[보충설명 1] 단백질 구조의 통계적 모음
통계역학에서 통계적 모음(ensemble)은 시스템의 모든 상태들을 각 상태로 존재할 확률까지 포함하여 모은 집합으로 정의할 수 있다. 이러한 방식으로 기술하는 것은 시험관 내에서나 생명체 내에서 모두 수용액 상태에 있는 단백질을 기술하기에, 최소한 그들이 변화(예를 들어 화학 반응)를 겪지 않을 때만큼은 적절하다. 이 관점을 취하면, 단백질 구조의 통계적 모음은 그 가능한 구조들의 확률 분포로 정의할 수 있고, 각 구조는 여러 가지로 정의될 수 있다. 예를 들면, 원자 좌표들로 정의될 수 있고, 혹은 자연 상태의 잔기간 접촉 정보나 2차 구조 요소들로 정의될 수도 있다. 평형 상태에 있는 구조의 통계적 모음에서, 단백질의 가능한 상태는 볼츠만 가중치(exp[-E/kBT]/Z)에 따른 확률로 존재한다. 여기서 E는 상태의 에너지, T는 온도, kB는 볼츠만 상수, 그리고 Z는 분배 함수로서, 볼츠만 가중치는 엔트로피 최대화와 에너지 최소화의 균형으로부터 도출된다. 따라서, 이 시스템 하에서, 무질서한 영역들은 단순히 무작위적인 구조와는 무척 다르다는 것을 알 수 있는데, 이는 대부분의 경우 실제 존재할 수 있는 많은 구조들이 갖는 통계적 가중치가 각 구조의 에너지에 따라 매우 달라지기 때문이다. 이 논평 속에서, 우리는 '단백질 동역학'이라는 용어로써 단백질이 구조의 통계적 모음 안에서 존재함을 가리킬 것이고, 주로 단백질의 평형 성질들을 가리킬 것이다('평형 동역학'). 그리고 비평형 성질들은 시스템이 가질 수 있는 상태들 간의 전이율에 관한 지식이 있어야 정량화가 가능하므로 가볍게 지나가며 다루기만 하겠다.

이 그림은 구조의 통계적 모음을 모델링하기 위해 사용할 수 있는 다양한 방법들로 측정되는 서로 다른 시간 차원(x축)과 길이 차원(y축)을 보여준다(윗부분). 분자동역학(MD; molecular dynamics) 방법론들은 붉은 배경 안에 표시하였다. X선 결정학과 전자 현미경(EM; electron microscopy) 역시 단백질이 가질 수 있는 여러 상태들을 조사하는 데 사용될 수 있다. 소각 X선 산란(SAXS; small-angle X-ray scattering)과 소각 중성자 산란(SANS; small-angle neutron scattering), 그리고 원자 힘 현미경(AFM; atomic force microscopy)과 광 집게(optical tweezer) 역시 밀리초 이하의 시간 차원에서 동역학을 검출할 수 있고 큰 복합체의 다양한 구조들을 찾아낼 수 있다. 또한 본문에서 다뤄지는 다양한 NMR 기법들을 통해서 검출할 수 있는 다양한 시간 차원 역시 표시하였다(아랫부분). CS는 화학적 이동(chemical shift), RDC는 잔기 이극 결합(residual dipolar coupling), CPMG는 Carr-Purcell-Meiboom-Gill의 줄인 말이다.

NMR 분광학의 발흥
최근 가장 흥분되는 구조생물학의 발전 중 하나는 NMR 방법론으로 단백질의 구조 요동을 정량적으로 측정할 수 있게 된 것으로, 이로써 단백질의 질서와 무질서를 동시에 측정할 수 있는 강력한 도구가 생긴 셈이다. 이와 같은 발전은 기실 NMR 분광학의 오랜 역사에 단단히 뿌리를 내리고 있다. 이 기법의 성공은 자연 상태 구조를 수용액 내에서 결정할 수 있는 능력에서 기인하는데, 이는 심지어 X선 결정학이 고체 상태에서 얻은 구조 정확성과 비교할 만한 구조 정확성을 주기도 했다. 반면 X선 결정학과의 차이점으로는, NMR 분광학은 넓은 범위의 시간 규모에서 수용액 상의 단백질 동역학을 조사할 수 있다는 것이다(보충설명 1, 위). 화학적 이동(chemical shift)과 잔기 이극 결합(residual dipolar coupling)은 밀리초 시간 범위까지 포괄하는데, 이로써 리간드 결합과 다른 자리 입체성(allostery)에서부터 촉매와 단백질 접힘까지의 화학 과정들을 검출할 수 있다. 핵 오버하우저 효과(nuclear Overhauser effect; NOE)나 세로(R1) 및 가로(R2) 이완 과정을 이용하는 다른 NMR 측정 기법들은 피코초에서 나노초 시간 범위를 측정할 수 있고, 곁사슬의 회전과 국지적 움직임에 대한 정보를 제공한다. 상자성 이완 증강(paramagnetic relaxation enhancement; PRE)과 전자 상자성 공명(electron paramagnetic resonance; EPR) 실험들은 밀리초 시간 범위의 동역학을 알려주고, 이는 보통 접힘 중간체들과 리간드 결합 과정에 해당한다. 밀리초 시간 범위를 살펴보는, NMR R1r 회전 좌표계 이완과 Carr-Purcell-Meiboom-Gill (CPMG) 실험들은 접힘과 결합 중간체에 대한 정보를 제공한다. NMR 기법들로 도달할 수 있는 가장 긴 시간 범위로, 실시간 NMR과 수소-중수소(H-D) 교환 데이터는 초 단위 시간 범위를 넘어가는 동역학을 관찰할 수 있고, 이는 복합체 단백질의 접힘에 해당한다. 게다가, NMR 측정 기법들은 단백질의 구조 요동을 평균한 값을 알려주기 때문에, 이들은 이 분자들이 차지하고 있는 서로 다른 구조들(즉, 구조의 통계적 모음)을 결정함으로써 평형 동역학에 대한 정보를 제공할 수 있다(보충설명 1). 특별히 NMR 분광학은 자체적으로 매우 동적이고 결정화(crystallization)될 수 없는 상태들에 대한 구조 정보를 제공하는 데 중요한 역할을 하고 있다. 그리고 NMR 분광학을 이용하여 서로 다른 상태들 사이의 전이율을 결정하는 것이 점차 가능해지고 있고, 그 결과 비평형 동적 과정에 대한 분석 역시 가능해지고 있다(보충설명 1).

구조의 통계적 모음을 결정하는 데 겪는 어려움
단백질 구조의 통계적 모음을 정확히 결정하는데 NMR 분광학이 뛰어난 잠재성을 보여준 것은 사실이나, 이 일은 여전히 무척 어렵다. 대부분의 경우, 실험 데이터는 모든 접근 가능한 상태들에 대한 가중치 평균값을 보여주는데, 여기서 이 측정된 평균값으로부터 각기 다른 상태들을 분해해야 하는 '분해 문제'가 생긴다. 게다가, 이 평균값들이 주는 정보(보통 다른 종류의 실험들로부터 구한다)는 매우 적은데, 예를 들어 몇 가지 결합 각도나 원자간 거리를 줄 뿐으로, 이 정보들은 서로 일관성 있게 조합되어야 한다. 끝으로, 실험 데이터는 무작위적인 그리고 체계적인 오차의 영향 아래 있고, 컴퓨터 시뮬레이션에서 사용되는 에너지 함수들은 단백질과 용매를 구성하는 원자들 간의 실제 상호작용에 대한 근사에 불과하다. 따라서 다양한 종류의 실험 데이터를 기존에 알고 있는 지식(예를 들어 역장 force field의 지식)과 조합하여 구조의 통계적 모음을 모델링하도록, 다양한 수준의 복잡성을 가진 여러 기법이 개발되어 왔다. 이 기법들을 적용하여 만든 통계적 모음들은, 기능적으로 영향을 줄 수 있는 작은 수준의 자연 상태 요동부터 무질서한 단백질들이 차지하고 있는 구조적으로 서로 다른 상태들 사이를 오가는 큰 규모의 움직임까지, 다양한 수준의 동역학이 존재함을 보여주었다.

구조의 통계적 모음을 수집하자
매우 일반적으로 말하면, 통계적 모음을 모델링하는 어느 기법이라도 다음과 같은 몇 가지 요소를 고려할 수 밖에 없다. (1) 결과로 나오는 구조의 통계적 모음의 질. 특히 이로부터 뽑아낼 수 있는 정보의 양. (2) 사용 가능한 실험 데이터의 양과 질. (3) 기법을 적용하는데 드는 시간과 자원. 단백질 데이터 은행(Protein Data Bank; PDB)에는 매우 적은 수의 구조의 통계적 모음만이 포함되어 있다. NMR 분광학으로 결정된 단백질 구조들의 경우 종종 해당 NMR 데이터를 설명할 수 있는 여러 모델들의 정보를 같이 입력하기는 하나, 서로 다른 상태들의 통계적 집단까지 포함시키지는 않는다. 따라서, 이는 '통계적 모음'이라기보다 '불확실성 모음'이다. 이 문제를 해결하기 위해, 최근 단백질 통계적 모음 데이터베이스(Protein Ensemble Database; PED)가 만들어졌다. 하지만, 여전히 그 데이터의 수는 매우 적은데(현재 24개), 이는 정확히 구조의 통계적 모음을 계산하는 것이, 계산 자원과 필요한 실험 데이터의 양과 질의 두 가지 측면에서 모두 매우 부담스러운 일이기 때문이다. 또한, PED에 있는 많은 구조 모음들이 아직 통계적 분포에 대한 정보를 포함하지 않고 있기에 단백질이 가장 많이 분포하는 상태들을 찾아내기가 힘들다. 전반적으로 말해, 통계적 모음을 결정하는 것은 여전히 벅찬 일이지만, 정확한 실험 및 이론 기법들이 점차 늘어나고 있을 뿐 아니라 컴퓨터의 계산 능력 또한 급격히 성장하고 있기에, 단백질의 수용액 속 성질들을 단순한 정적 상태보다 포괄적으로 기술할 수 있는 구조의 통계적 모음을 수집하는 큰 보관소가 장차 개발될 것이라는 기대를 할 수 있다.

2차원 통계적 모음
앞에서 묘사한 바와 같이 ('3차원') 구조의 통계적 모음을 결정하는 데 겪는 어려움들을 고려해 보면, 이와 다른 전략은 '2차원 통계적 모음'에 집중하는 것이다. 2차원 통계적 모음은 단백질의 매우 동적인 상태의 쓸모있는 성질들에 대한 정량적인 정보를 줄 수 있는 동시에, 일반적으로 계산이 더 쉽다. 한 가지 예로써, 단백질 질서 및 무질서 데이터베이스(Protein Order and Disorder Database; PODD, http://www-mvsoftware.ch.cam.ac.uk/index.php/podd)에는 약 5천 개의 단백질에 대해 δ2D 방법으로 측정한 NMR 화학적 이동으로부터 직접적으로 결정된 2차 구조 분포에 대한 2차원 통계적 모음들이 모여 있다. 인간 프리온 단백질 구조의 통계적 모음(그림 1a)과 이에 대응하는 2차 구조 분포(그림 1b)를 예로 비교해 보자. 이 2차원 통계적 모음들이 원자 좌표의 확률 분포나 3차 접촉에 대한 정보를 주지는 않지만, 국지적 안정성과 구조 불균일성에 대한 유용한 예측치를 제공한다. PODD에 모여있는 잔기들의 많은 양은 α 나선과 β 가닥을 모두 만들 수 있는 단백질의 불균일한 영역에 존재한다(그림 1c). 2차 구조 분포를 이용하는 주된 이점은 이 분포를 결정하는 것이 계산적으로 비싸지 않고, 뼈대의 화학적 이동은 보통 쉽게 측정할 수 있다는 것이다. 게다가, 화학적 이동을 측정할 수 없을 때라도, 2차 구조 분포는 (예를 들어 s2D 방법론을 써서) 아미노산 서열로부터 예측할 수 있다.

PODD 단백질들의 구조적 특성을 분석해 보면 질서와 무질서 사이의 연속체 개념을 잘 드러낸다. 질서와 무질서 사이의 어떠한 구분도 절대적이지 않고, 둘 사이의 연속성을 깨기 위해 분포상에 임의로 도입한 기준값에 의존한다. PODD 안에 있는 가장 동적인 영역들(NMR 측정에서 유도된 분포)이 보통 전통적으로 무질서하다고 정의되던 영역과 유사하다는 것을 확인하기 위해, 우리는 이들이 현존하는 무질서 예측 프로그램들로 발견될 수 있는지 시험해 보았다. PODD 안의 2차원 통계적 모음들에 대한 이 무질서 예측값들을 서로 비교하기 위해, 우리는 분포에 기준값을 도입했다. 이에 따라 우리는 최소한 L개의 연속된 잔기의 α 나선과 β 가닥 분율이 모두 0.5보다 작다면 해당 영역을 무질서하다고 정의하였고, 서로 다른 L값에 대해 다양한 예측 프로그램들의 균형 정확도(balanced accuracy)를 계산하였다. 그 결과로 얻은 정확도는, 무질서를 전자 밀도 정보가 없는 영역으로 정의한 더 큰 데이터 집합에 대해 얻은 값과 크게 다르지 않았고, 이로써 전통적인 질서-무질서 이분법 정의들이 PODD가 제공하는 연속체 정량법 안에 포함되어 있음을 알 수 있다.

현재의 어려움과 기회들
사용 가능한 NMR 기법들이 늘어나면서 복잡한 분자 시스템도 연구할 수 있게 되었다. PODD 주석과 같은, 단백질의 평형 동역학에 관한 정량적 묘사는 연구 중인 단백질의 기능적 상태를 유추하는데 사용될 수 있다. 예를 들어 트로포닌(troponin) I의 심장 동형 단백질의 경우(그림 2a), 2차 구조 분포로부터 어떻게 결합 상대가 존재함으로써 질서와 무질서 상태 사이의 평형을 이동하는지 알 수 있다. 이런 종류의 분석은 기능적으로 의미 있는 영역을 밝혀내고 구조적인 특성을 찾아내는 데 사용될 수 있다. 또한, 세포 내 NMR 분광학의 발전으로 박테리아 및 포유류 세포 단백질의 구조와 동역학을 연구하는 것이 점차 가능해지고 있다. PODD에서 사용된 화학적 이동 분석법은 이미 이런 연구에 적용되고 있으며, 단백질의 생물학적 맥락 속에서 그 구조를 빠르게 연구하게 해준다. 게다가, 이 방법으로 결정된 2차 구조 분포는 훨씬 통제된 시험관 내 실험들에서 측정된 분포와 비교하여 세포 내의 의미 있는 상태들을 밝혀내는 데 사용될 수 있다. 예를 들어, 세포 내 알파-시누클레인(α-synuclein)의 2차 구조 분포는 시험관 내에서 단량체 단백질이 홀로, 혹은 라우로일사르코신산 소듐(sodium lauroyl sarcosinate; SLAS) 마이셀과 결합한 형태일 때 측정된 분포와 비교할 수 있다(그림 2b). 이 비교를 통해 세포 내 알파-시누클레인의 2차원 통계적 모음이 본질적으로 시험관 내의 단량체 단백질의 통계적 모음과 같다는 것을 알 수 있으며, 이는 다른 NMR 측정을 통해 포유류 세포 속에서 최근에 관찰된 결과와 일치한다. 게다가, NMR 분광법을 라이보좀-미완성 사슬 복합체(ribosome-nascent chain complex; RNC 복합체)와 같은 복잡한 초분자 시스템의 동역학을 관찰하는 데 사용하는 것이 점차 가능해지고 있다. 면역글로불린 유사 도메인(imuunoglobulin-like domain)의 동시 번역 접힘(cotranslational folding)에 관한 최근 연구에서 RNC 복합체는 분리된 도메인의 접힌 상태 β 가닥에 비해 약간 더 불안정한 β 가닥를 가지고 있음이 밝혀졌고, 이로써 이 도메인은 라이보좀에 묶여 있을 때에도 본질적으로 접혀 있음을 알 수 있다(그림 2c).

[그림 2] 2차원 통계적 모음을 통해 단백질의 질서와 무질서를 동시에 정량화하기.

(a) 트로포닌 I 심장 동형 단백질의 N 말단 영역(cTnI[1-73]). 수용액 상태(위 패널, BMRB ID bmr25118)와 심장 트로포닌 C(cTnC)에 결합된 상태(아래 패널, bmr25119). (b) 세포 내 NMR 실험으로 찾아낸 알파-시누클레인의 α 나선과 임의 고리 분포(bmr19257)와 정제된 단백질의 해당 분포. 정제된 단백질은 수용액 상태의 단량체 상태(bmr6968)와 SLAS 마이셀에 결합된 상태(bmr16302)에서 측정되었다(그림의 범례를 보라). 통계적 모음에서 빠진 점들은 배정된 화학적 이동을 보이지 않는 잔기들에 해당한다. 이 분석을 통해 알파-시누클레인이 세포 내에서 분포하는 상태가 막에 결합한 상태보다 해당 단량체의 무질서한 상태와 더 유사함을 알 수 있고, 이는 최근의 발견과 완전히 일치한다. (c) 라이보좀-미완성 사슬 복합체의 일부인 면역글로불린 유사 도메인의 β 가닥과 임의 고리 분포(bmr25748). 분리된 도메인의 자연 상태 및 변성된 상태와 비교하였다(bmr15814, 범례를 보라).

전망
우리의 의견으로는, 이제 수용액 내 단백질의 동역학을 효과적으로 드러낼 수 있는 더 강력한 정량적 구조 방법론과 주석을 개발하는데 도전할 때가 무르익었다. 앞서 기술한 PODD 데이터베이스는 2차 구조 분포의 정의로부터 얻어낸 구조와 평형 동역학을 포괄하는 정량적인 주석 시스템을 제공함으로써 이 방향으로의 진일보를 나타낸다. 우리는 가까운 미래에 이러한 주석 시스템들의 정보와 정확도를 늘리는 일이 가능할 것이라고 본다. 3차 접촉을 직접 측정할 수 있는 실험 데이터를 더 많이 구하는 것이 한 가지 실행 가능한 전략으로, 이로써 구조의 통계적 모음을 결정할 수 있는 통합적 구조 생물학 방법론으로 점차 가까이 나아갈 수 있다. 이를 보완하는 전략으로, 추가 실험 없이 더 많은 선험적 지식을 통합하는 전략이 있다. 이 방법론은, 예를 들어 현재 NMR 화학적 이동 데이터로부터 구조를 예측하는 방법론들이 하는 것과 같이, 점차 늘어나고 있는 접근 가능한 구조 데이터나 점차 정확해지고 있는 역장들을 활용하는 식으로 적용될 수 있다. 따라서 우리는 NMR 분광학을 다른 실험 및 계산 접근법들과 접목하여 사용하면 점차 단백질의 구조 및 동역학 분석을 대규모로 해낼 수 있으리라 전망한다. 구조와 동역학을 동시에 하나의 틀 안에 포함하는 능력은 단백질 내의 질서와 무질서가 갖는 생물학적 역학을 이해하는데 도움을 줄 것이며, 기능, 상호작용, 다른 자리 입체성 조절의 기본 메커니즘들과 신약 개발의 새로운 방법론을 밝혀내는 추가적인 기회들을 제공할 것이다.


+ 최신 글