Сегодня будет лютейшая история.

28 июля 2025 г.

Сегодня будет лютейшая история.

Есть такая офигенная прикладная технология — генный чип. Это типа как набор анализов, только их можно провести сразу под несколько миллионов. Удобнее всего туда плюхать ДНК и спрашивать её про конкретные гены.

Сама технология появилась тогда, когда молекулярные биологи пришли к производителям процессоров и попросили дать литограф погонять на месяц-другой.

Погоняли.

Условно, получилась хреновина, куда надо плюнуть. На ней, скажем, 900 тысяч пикселей, каждый из которых — один IF для поиска чего-то в ДНКе.

Обычно для исследования генома вам надо плевать в ДНК-секвенатор. Он читает всю ДНК и просто выдаёт сырой код. А если вам нужен только один IF — можно плевать в сотрудника ПЦР-лаборатории.

А есть полногеномный поиск ассоциаций. Когда можно задать много-много вопросов на да/нет одному образцу.

На чипе в каждом пикселе закреплены миллионы коротких фрагментов ДНК — это зонды. Каждый зонд ищет одну конкретную генетическую вариацию. Чаще всего ищут простое генетическое различие всего одного бита (нуклеотида) в коде ДНК.

Как работает: фрагменты вашей ДНК плывут над поверхностью чипа и прилипают к коннекторам своей формы. Если к коннектору что-то прилипло, он начинает химически светится. В итоге одна лазерная фотография — и мы получаем все TRUE/FALSE для каждого зонда, где TRUE — там пиксель горит, где FALSE — не горит.

Сам зонд обычно от 20 до 70 нуклеотидов. Там записана сигнатура конкретного участка ДНК. Наносят зонды фотолитографией или струйной печатью (споттингом микрокаплями).

Литография делается примерно так же, как печатаются процессоры. Берём подложку, стекло или кремний с липким линкером. Дальше сверху можно наносить нуклеотиды A, T, C, G, но с фото-лабильной защитной группой. Там на коннекторе заглушка, которая разваливается от ультрафиолета.

Из этих нуклеотидов и делаются IF’ы, то есть вопросы к образцу.

Дальше берём фотомаски — инструмент от производителей процессоров. Это пластины из кварца, на которые нанесен рисунок из непрозрачного материала (например, хрома). Маска пропускает УФ-лучи только через свои прозрачные участки. Для каждого шага синтеза нужна своя маска.

Прикладываем трафарет №1, светим, снимаем маску, покрываем весь чип А-молекулами (они крепятся только к тем точкам, куда посветили), моем. Прикладываем трафарет №2, светим, убираем трафарет, покрываем весь чип T-молекулами, моем и так далее.

Чтобы построить зонды длиной 25 нуклеотидов, нужно до 100 таких основных циклов (25 позиций и 4 типа нуклеотидов). Бывают чипы размером несколько квадратных сантиметров на 7 миллионов IF’ов.

Можно разом поискать все генетические склонности или провести статистический анализ популяций на предмет различий в генах. Например, если взять больных и здоровых и посмотреть, чем они статистически отличаются в ДНК. Удобно диагностировать разные генетические заболевания и искать ДНК патогенов в слюне или крови.

Можно крайне грубо представить, что это прекомпилированный пакет из нескольких миллионов ПЦР-реакций, только меньше и других. Но: — Стоит разработка чипа как самолёт, зато если вам нужны миллионы чипов — это офигенно выгодно. — Это именно куча IF’ов типа «а по смещению такому-то какой бит записан?», а не секвенирование, то есть хрен вам, а не гибкость. — Чем длиннее зонд, тем он хуже печатается. Сигнатуры длиннее 60 нуклеотидов глючат. В нашем спагетти-коде есть гены, у которых чисто архитектурно сигнатуры длиннее, иначе будут повторы с другими. — Чип — это поиск сигнатур, а не чтение кода. Неизвестные и новые варианты кода пролетают мимо. Нельзя найти вариант, к которому нет зонда. Ответ бинарный, «нашлось» или «нет» без «где» и «сколько». — Чипом чаще ищут однобуквенные замены, секвенатором — вставки, удаления, крупные структурные перестройки, можно посчитать число копий генов.

Вступайте в ряды Фурье! — Ребята, у кого есть учебники по фотолитографии, архитектуре процессоров и генетике? Дайте, пожалуйста. — Ой, молодец какая! Решила за науку взяться! — Мне для фотосессии.

166 🔥 104 👍 41 🥴 4 😍 4 🐳 4