Nature Genetics 55권, 964~972페이지(2023)이 기사 인용
10,000회 액세스
1 인용
429 알트메트릭
측정항목 세부정보
자발 관상동맥 박리(SCAD)는 주로 여성에게 영향을 미치는 심근경색의 원인에 대해 잘 연구되지 않았습니다. SCAD가 죽상동맥경화성 관상동맥질환(CAD)을 포함한 다른 심혈관 질환과 유전적으로 어느 정도 구별되는지는 알려져 있지 않습니다. 여기에서는 SCAD에 대한 16개의 위험 유전자좌를 식별하는 게놈 전체 연관 메타 분석(1,917개 사례 및 9,292개 대조군)을 제시합니다. 통합 기능 주석은 혈관 평활근 세포 및 동맥 섬유아세포에서 조절되고 세포외 기질 생물학에 연루될 가능성이 있는 유전자를 우선시했습니다. 혈액 응고 연속 개시에 관여하는 조직 인자 유전자 F3을 포함하는 한 유전자좌는 SCAD 위험에 특이적인 것으로 보입니다. 여러 관련 변이체는 CAD와 정반대의 연관성을 갖고 있으며, 이는 공유된 생물학적 과정이 두 질병 모두에 기여하지만 메커니즘은 서로 다르다는 것을 시사합니다. 우리는 또한 SCAD에서 고혈압의 인과적 역할을 추론합니다. 우리의 연구 결과는 SCAD에서 동맥 무결성 및 조직 매개 응고와 관련된 새로운 병리생리학적 통찰력을 제공하고 미래의 특정 치료법 및 예방을 위한 무대를 설정합니다.
심혈관 질환은 여성의 주요 사망 원인이지만, 심장 질환 및 급성 심근경색(AMI)의 위험에 대한 성별별 측면은 아직 연구가 부족합니다1. 자발 관상동맥 박리(SCAD)와 죽상동맥경화성 관상동맥 질환(CAD)은 둘 다 AMI로 이어지는 급성 관상동맥 증후군의 원인입니다2,3,4,5,6. 그러나 CAD와 달리 SCAD는 젊은층, 주로 여성 집단에 영향을 미치고7 혈종 발생으로 인해 발생하여 죽상동맥경화성 플라크 침식 또는 파열보다는 궁극적으로 거짓 내강이 형성되는 관상 동맥 막 매체의 박리로 이어집니다8. SCAD는 편두통9 및 섬유근이형성증(FMD)10,11,12,13을 포함한 관상동맥외 동맥병증과 임상적으로 연관되어 있습니다. 그러나 관상동맥 죽상동맥경화증이 동반되는 경우는 드뭅니다8,14. CAD의 유전적 기초는 점점 더 잘 확립되어 있지만 SCAD의 병태생리학은 여전히 잘 이해되지 않고 있습니다. 후보 경로 또는 시퀀싱에 의한 침투성이 높은 돌연변이에 대한 검색은 낮은 수율을 얻었으며 종종 SCAD16으로 나타나는 임상적으로 진단되지 않은 다른 유전 증후군과 관련된 유전자를 가리키는 경우가 많습니다. SCAD의 위험에 대한 일반적인 유전적 변이의 영향에 대한 이전 조사에서는 5개의 확인된 위험 유전자좌17,18,19,20가 설명되어 있습니다.
이 기사에서 우리는 1,917건의 SCAD 사례와 9,292건의 유럽 가계 대조군으로 구성된 게놈 차원 연관 연구(GWAS)에 대한 메타 분석을 수행했습니다. 우리는 11개의 새로운 연관 신호를 포함하여 16개의 위험 유전자좌를 식별하여 이 질병에 대한 실질적인 다유전적 유전성을 입증했습니다. 중요하게도, 우리는 SCAD에 대한 몇 가지 일반적인 유전적 위험 유전자좌가 CAD와 공유되지만 방향적으로 반대 효과가 있고 확립된 심혈관 위험 요인의 유전적 기여도가 다르다는 것을 보여줍니다. 이러한 발견은 SCAD의 병태생리학에서 세포외 기질 생물학, 혈관 긴장도 및 조직 응고와 관련된 동맥 완전성을 암시합니다.
우리는 8개의 독립적인 사례 관리 연구에 대한 GWAS 메타 분석을 수행했습니다(보충 그림 1 및 2 및 보충 표 1). 16개의 유전자좌는 SCAD와 관련하여 게놈 전반에 걸쳐 중요한 신호를 나타냈으며 그 중 11개가 이 질병에 대해 새로 설명되었습니다(표 1, 그림 1a, 보충 표 2 및 보충 그림 3). 염색체 4의 한 유전자좌(AFAP1)는 최근 임신과 관련하여 SCAD에 대해 보고되었으며19 현재 SCAD에 일반적으로 관여하는 것으로 확인되었습니다(표 1). 관련 유전자좌의 추정 교차비는 염색체 4의 ZNF827에서 1.25(95% 신뢰 구간(CI) = 1.16–1.35)에서 KCNE2 근처 염색체 21의 2.04(95% CI = 1.77–2.35) 범위였습니다(표 1). 우리는 추정된 단일 염기 다형성(SNP) 기반 유전성이 0.70 이상인 SCAD에 대한 실질적인 다원성에 대한 증거를 보고합니다(연관 불균형 점수 회귀를 사용하여 책임 척도에서 h2SNP = 0.71 ± 0.11 및 SumHer22를 사용하여 h2SNP = 0.70 ± 0.12; 보충 표 3 ). 염색체 1의 ECM1/ADAMTSL4 유전자좌는 우리 데이터 세트(h2 = 0.028)에서 SCAD에 대한 유전성의 가장 큰 비율을 차지했으며, 두 개의 독립적인 GWAS 신호(h2 = 0.022, 보충 표 4 및 보충)를 포함하는 COL4A1/COL4A2 유전자좌가 그 뒤를 이었습니다. 그림 4). 전반적으로 우리는 16개 유전자좌가 SCAD의 전체 SNP 기반 유전성의 ~24%를 설명한다고 추정합니다(보충 표 4).
1% of cells in artery tissue24. The SCAD 95% credible set of causal SNPs and their linkage disequilibrium proxies were matched to random pools of neighboring SNPs using the GREGOR package43. Enrichment represents the ratio of the number of SCAD SNPs overlapping open chromatin regions over the average number of matched SNPs overlapping the same regions. P values were evaluated by binomial one-sided test, with greater enrichment as the alternative hypothesis43. The bottom dashed line represents significance (P < 0.05) after adjustment for 105 subclusters. Higher opacity is used to identify significant associations (adjusted P < 0.05). Bottom, composition of artery tissues relative to 105 single-cell subclusters, as determined by snATAC-seq in 30 adult tissues24. Only subclusters representing >1% of cells from either the aorta or tibial artery were represented. b, Representation of the SCAD TWAS z score for each prioritized gene in GWAS loci. The point shape indicates the tissue used in the TWAS association. The point color distinguishes genes located at different loci. The absence of a symbol indicates that the gene did not show significant heritability based on the eQTL data in the corresponding tissue. TWAS P values were calculated by two-tailed z test against a null distribution calculated by permutation for each gene or tissue44. Higher opacity is used to identify significant associations (Bonferroni adjusted P < 0.05), corresponding to a z score of >4.8 or <−4.8 (dashed gray lines)./p>90%)2,4. Using genetic association colocalization and genetic correlation, we genetically compared SCAD with CAD. We found that, among SCAD loci, several were known to associate with CAD. Disease association colocalization analyses showed that for six loci SCAD and CAD are likely to share the same causal variants with high posterior probabilities (posterior probability of the shared causal variant hypothesis (H4) = 84–100%), but all with opposite risk alleles (Fig. 3a and Supplementary Table 7). Genetic correlation confirmed a genome-wide negative correlation between SCAD and CAD (rg = −0.12 ± 0.04; P = 3.7 × 10−3) (Supplementary Table 10), including after conditioning SCAD GWAS results on systolic blood pressure (SBP) or diastolic blood pressure (DBP) GWAS results using the multitrait-based conditional and joint analysis (mtCOJO) tool31 (rgCAD/SBP = −0.19 ± 0.04 (P = 4.6 × 10−6); rgCAD/DBP = −0.19 ± 0.04 (P = 1.3 × 10−5)) (Supplementary Table 12 and Supplementary Fig. 11)./p> 0.7) with the lead SNP at each locus, based on information from European populations (1000 Genomes reference panel) queried using the ldproxy function of the LDlinkR package (version 1.1.2)49./p>1% of cells in at least one arterial tissue (T lymphocyte 1, CD8+, endothelial general 2, endothelial general 1, macrophage general, fibroblast general, vascular smooth muscle 2 or vascular smooth muscle 1) were extracted and grouped by annotated cell type as T lymphocytes, macrophages, fibroblasts, endothelial cells and VSMCs, respectively. Genome coverage was calculated using the bedtools (version 2.29.0) coverage function. We detected peaks from bedGraph output using the MACS2 bdgpeakcall function (Galaxy Version 2.1.1.20160309.0) on the Galaxy webserver52,53. All peak files were extended 100 base pairs upstream and downstream using the bedtools (version 2.29.0) slop function. We detected overlaps of SCAD potential functional variants with relevant genomic regions using the findOverlap function from the rtracklayer package (version 1.52.1)54. We used the Integrated Genome Browser (version 9.1.8) to visualize read density profiles and peak positions in the context of the human genome55./p>75% or if eQTL association was significant for SCAD lead SNPs and H4 was over 25%. TWASs were performed using the FUSION R/Python package44. Gene expression models were pre-computed from GTEx data (version 8 release) and were provided by the authors. Only genes with a heritability P < 0.01 were used in the analysis. Both tools used linkage disequilibrium information from the European panel of phase 3 of the 1000 Genomes Project. Bonferroni multiple testing correction was applied using the p.adjust function in R (version 4.1.0). Significant capture Hi-C hits in aorta tissue were provided as supplementary data by Jung et al.25. Genes associated with mouse cardiovascular phenotypes (code MP:0005385) were retrieved from the Mouse Genome Informatics database (www.informatics.jax.org)56. We also queried the DisGeNET database, using the disgenet2r package (version 0.99.2), for genes with reported evidence in human cardiovascular disease (code C14) with a score of >0.2, including “ALL” databases57. In the absence of a missense variant, colocalization and TWAS criteria were given a tenfold weight compared with other criteria. At each locus, we prioritized genes fulfilling the largest number of criteria. In cases where several candidates were retained, we prioritized genes that were most likely to have a function in arterial disease (for example, expression in arterial tissues or exclusion of pseudo-genes)./p>30% across 1,000 generated Bayesian networks starting from different random genes. Bayesian networks were combined for the top GWAS hits query, and mouse gene symbols were converted to their human orthologs. Bayesian networks were queried for the identified top GWAS hits to identify their first-degree network connections and to determine connections between their surrounding subnetwork nodes. The directions of edges were informed by prior knowledge, such as eQTLs and previously known regulatory relationships between genes. Subnetworks were annotated by top biological pathways representative of the subnetwork genes using Enrichr with a false discovery rate of <0.05./p> 0.9) and located within 500 kb from the SCAD lead SNP. COL4A1 and COL4A2 loci were separated by placing an equidistant border from SCAD lead SNPs for the inclusion of SNPs in the analysis. Signal colocalization was evaluated using the R coloc package (version 5.1.0) with default values as priors. We reported H4 coefficients indicating the probability of two signals sharing a common causal variant at each locus./p> 0.6 within a 10,000 kb window)./p>