Человек 2.0. Перезагрузка. Адам ПиорейЧитать онлайн книгу.
слову техники. Называются они «Illumina HiSeq 2000».
Каждый 13-дневный цикл работы одной «Иллюмины» дает 600 гигаоснований информации (т. е. данные о 600 млрд нуклеотидов). Таким объемом генетических сведений можно заполнить шесть этажей библиотеки, на каждом из которых в общей сложности 900 м полок для научных журналов. Это в 1200 раз больше того количества данных, который поместится на обычном CD-ROM. Иначе говоря, на этих шести библиотечных этажах может храниться результат полной расшифровки геномов 200 человек, объемом по 3 млрд нуклеотидов. (Правда, для BGI это был бы результат расшифровки всего десяти геномов: каждый геном она секвенирует по 20 раз, чтобы добиться высочайшей статистической точности.) Таким образом, компания расшифровывает около 1730 геномов каждые 13 дней. Где-то во всех этих данных таятся закономерности, которые могут содержать указание на то, что же делает нас такими, какие мы есть, – и за какие молекулярные рычаги мы могли бы потянуть, чтобы позволить всем желающим преобразиться, став такими, какими они хотят стать.
После того как «Иллюмины» извергнут свои данные, целая армия молодых сотрудников, сидящих по ту сторону границы, в Шэньчжэне (в офисных ячейках, которые располагаются в огромном помещении, напоминающем склад), приступает к следующей стадии работы – очистке этой информации и поиску корреляций между определенными буквами в ДНК-последовательности и носителями определенных черт или заболеваний: возможно, эти особенности можно будет связать с конкретными генами.
Чтобы эффективно проводить все эти сопоставления, BGI организовала несколько вычислительных центров, оснащенных суперкомпьютерами. Анализ ДНК – математическая проблема на много порядков сложнее, чем выяснение взаимосвязей между различными частями человеческой руки или ноги, которое (как мы узнали из предыдущей главы) находилось далеко за пределами досягаемости предыдущих поколений инженеров-биомехаников: лишь в наше время специалисты вроде Хью Герра и Патрика ван дер Смагта получили возможность моделировать взаимодействия этих бесчисленных переменных и выявлять, как эти параметры связаны друг с другом и с движениями человека.
Герру приходится работать с тысячами переменных, а компании BGI – с миллиардами, так что ее аппетиты по части вычислительных мощностей постоянно растут и никогда не находят полного удовлетворения. Растет и объем компьютерной памяти, находящийся в распоряжении корпорации. Цель – достичь общей производительности в тысячу терафлопсов (иными словами, в 1 квадриллион операций в секунду). Незадолго до моего визита компания объявила, что сумела превысить четверть этой величины. В рамках некоторых проектов, требующих, чтобы статистики компании одновременно проводили сложный регрессионный анализ множества нуклеотидных последовательностей (каждая – длиной в 3 млрд нуклеотидов), китайское правительство разрешает BGI доступ к некоторым из самых мощных суперкомпьютеров в мире, расположенным в вычислительных центрах, которые