[저자] Adam Frankish, Mark Diekhans, Irwin Jungreis, Julien Lagarde, Jane E Loveland, Jonathan M Mudge, Cristina Sisu, James C Wright, Joel Armstrong, If Barnes, Andrew Berry, Alexandra Bignell, Carles Boix, Silvia Carbonell Sala, Fiona Cunningham, Tomás Di Domenico, Sarah Donaldson, Ian T Fiddes, Carlos García Girón, Jose Manuel Gonzalez, Tiago Grego, Matthew Hardy, Thibaut Hourlier, Kevin L Howe, Toby Hunt, Osagie G Izuogu, Rory Johnson, Fergal J Martin, Laura Martínez, Shamika Mohanan, Paul Muir, Fabio C P Navarro, Anne Parker, Baikang Pei, Fernando Pozo, Ferriol Calvet Riera, Magali Ruffier, Bianca M Schmitt, Eloise Stapleton, Marie-Marthe Suner, Irina Sycheva, Barbara Uszczynska-Ratajczak, Maxim Y Wolf, Jinuri Xu, Yucheng T Yang, Andrew Yates, Daniel Zerbino, Yan Zhang, Jyoti S Choudhary, Mark Gerstein, Roderic Guigó, Tim J P Hubbard, Manolis Kellis, Benedict Paten, Michael L Tress, Paul Flicek
[Category] MERS, 유전자 메커니즘,
[Article Type] AcademicSubjects/SCI00010
[Source] PMC
Abstract The GENCODE project annotates human and mouse genes and transcripts supported by experimental data with high accuracy, providing a foundational resource that supports genome biology and clinical genomics. GENCODE annotation processes make use of primary data and bioinformatic tools and analysis generated both within the consortium and externally to support the creation of transcript structures and the determination of their function. Here, we present improvements to our annotation infrastructure, bioinformatics tools, and analysis, and the advances they support in the annotation of the human and mouse genomes including: the completion of first pass manual annotation for the mouse reference genome; targeted improvements to the annotation of genes associated with SARS-CoV-2 infection; collaborative projects to achieve convergence across reference annotation databases for the annotation of human and mouse protein-coding genes; and the first GENCODE manually supervised automated annotation of lncRNAs. Our annotation is accessible via Ensembl, the UCSC Genome Browser and https://www.gencodegenes.org .
All Keywords
【초록키워드】 Structure, SARS-CoV-2, SARS-COV-2 infection, Genome, bioinformatics, database, improvement, automated, resource, convergence, Analysis, Support, creation, Improvements, completion, transcripts, annotation, high accuracy, transcript, Ensembl, UCSC Genome Browser, supported,
초록 GENCODE 프로젝트는 인간과 쥐의 유전자와 실험 데이터가 뒷받침하는 전사체에 높은 정확도로 주석을 달아 유전체 생물학과 임상 유전체학을 지원하는 기초 자원을 제공한다. GENCODE 주석 프로세스는 전사 구조 생성 및 기능 결정을 지원하기 위해 컨소시엄 내부 및 외부에서 생성된 기본 데이터 및 생물정보학 도구 및 분석을 사용합니다. 여기에서는 주석 인프라, 생물정보학 도구 및 분석에 대한 개선 사항과 다음을 포함하여 인간 및 마우스 게놈 주석에서 지원하는 발전을 소개합니다. 마우스 참조 게놈에 대한 첫 번째 통과 수동 주석 완료; SARS-CoV-2 감염과 관련된 유전자 주석에 대한 표적 개선; 인간 및 마우스 단백질 코딩 유전자의 주석을 위해 참조 주석 데이터베이스 전반에 걸쳐 수렴을 달성하기 위한 협력 프로젝트; 첫 번째 GENCODE는 lncRNA의 자동 주석을 수동으로 감독했습니다. 우리의 주석은 Ensembl, UCSC 게놈 브라우저 및 https://www.gencodegenes.org를 통해 액세스할 수 있습니다.