我試圖弄清楚如何下載代表完整人類DNA序列的文件。我不太在乎格式–我能夠編寫C ++代碼來解析它。 FASTA似乎是一種簡單的格式。我還沒有發現可以找到完整文件的地方–我發現了似乎是基因或其他序列的子集或單條染色體,但沒有46條染色體包含其中或其中一些重複(即22條染色體+ 2條性染色體)?
在此頁面上,我已經在“人類>基因組裝配體:GRCh38”下找到了此文件列表,但它似乎被染色體分解了嗎?如果是這樣,我可以合併這些嗎?我的目標是通過投影儀將所有字母顯示在牆上,我希望能夠指向它並告訴某人,這就是人類的全部DNA(而不是子集)。另外,要仔細檢查,這是我想要的“基因組裝配”嗎?順便說一句,我現在不在乎等位基因變體。
請在您的回復中考慮,我對許多術語並不熟悉,謝謝。