Для победы над старением, нам нужна биология с открытым кодом

Поделиться:

Обычно, по мере продвижения по карьерной лестнице в мокрой лаборатории, люди всё меньше работают руками и стараются как можно скорее сбежать из лаборатории. Чем выше человек в иерархии биологии, тем меньше вероятность, что он работает руками в лаборатории. Парадоксально, но чем больше времени ты проводишь с пипеткой, тем ниже ты находишься на карьерной лестнице.

В физике существует понятие отрицательной температуры — это не ниже нуля, она на самом деле выше бесконечной температуры. По сути, когда перегреваешь нечто бесконечно горячее, его температура становится отрицательной. Хороший пример — лазер. Технически он находится при отрицательной температуре.

Моя траектория пока что следует тому же тренду — я дошёл до максимума того, что ожидается от физика, затем то же произошло в сухой биологии, затем я достиг своей бесконечной температуры, понял, что мне нужно поработать в мокрой лаборатории и понять лучше, как она устроена — выключить аналитическое мышление ради улучшения механической памяти при работе с пипеткой. Обычно пипетирование считается рутиной — оно и ясно-понятно, если ты стремишься подняться по карьерной лестнице и выбраться из лаборатории. Если же к этому подходить это с чувством цели и пониманием, зачем ты это делаешь — становится приятнее. Да, я согласен, это не самое увлекательное занятие — капать жидкости, рассчитывать, сколько и в каком порядке капать. Но для меня это невероятно захватывающе, потому что я понимаю, зачем все это нужно. Я понимаю рутину, но вижу, какие части этого процесса можно автоматизировать, вижу то, как это исправить и ускорить.

ИИ уже почти заменил сухую компоненту науки. Единственное узкое место для автоматизации мокрой лаборатории — в основном социальное, а не физическое. Ладно, если честно, это требует глубокого понимания того, что действительно нужно делать — существует столько примеров лабораторного оборудования и софта, которые кричат «я понятия не имею, что разрабатываю, но вот продукт, который вы должны терпеть и использовать, потому что рынок олигополизирован и невероятно неэффективен». Часто инженеры по автоматизации подходят к автоматизации научной лаборатории так же, как подошли бы к автоматизации автомобильного производства. Они стремятся к точности, тогда как критический параметр — это надёжность и гибкость.

Модели ИИ становятся всё более демократичными в том смысле, что могут легко обрабатывать тонну релевантного контекста на лету. Вместо жёсткого кодирования каждой позиции каждой лунки вышестоящая модель может парсить контекст и адаптироваться к постоянно дрейфующим ошибкам калибровки. За этим будущее — робот, который может понять, что колба была перемещена в другое место, и автономно адаптироваться к этому. То же самое с поиском в холодильнике или морозилке, или снятием пластиковой обёртки с коробки с наконечниками для дозирования. Существует миллион плохо определённых шагов, которые сами по себе не сложны. Но если робот не способен автономно адаптироваться к этой гибкости на лету — он оказывается практически бесполезен. Мы в нескольких месяцах или годах от решения этой проблемы.

Подходы с “закрытым кодом” в биологии мертвы. Мы тратим $1–2 млрд на разработку лекарства, которое вылечит нескольких тяжелобольных людей от заболевания, например подтипа рака, название которого вы, вероятно, никогда не слышали. В то же время нам нужны масштабные усилия, чтобы сделать разработку лекарств более доступной для небольших команд и стартапов. Почему ИТ, ИИ и разработка ПО так масштабируемы? Потому что можно легко скопировать открытый код, улучшить и опубликовать снова, чтобы другие могли использовать его во множестве новых проектов. Экосистема позволяет всем выигрывать от большей открытости о том, что они делают и как. Это ускоряет прогресс и сотрудничество, снижает число глупых ошибок — от этого выигрывают все.

Будущее биологии — в открытом коде, то есть в открытом репозитории мокрых и сухих протоколов, которые каждый сможет воспроизвести с первого раза. Конечно, в ближайшем будущем это будет автоматизировано — каждый сможет приобрести универсального робота с открытым исходным кодом и использовать его для исполнения этих протоколов в лаборатории. Тем временем реальность такова, что у каждого поставщика есть свои протоколы, которые недостаточно детализированы, чтобы биоробот (то есть человек в лаборатории) или робот мог воспроизвести их с нуля. Почему? Потому что человеческий язык ограничен — «отцентрифугируйте», или «разделите по пробиркам» — точнее не напишешь. Поэтому каждый раз, когда новый человек хочет выполнить новый протокол, он обычно проводит несколько итераций и адаптирует его под свои лабораторные принадлежности методом проб и ошибок. Итоговый протокол может работать, но он не будет обновлён на сайте поставщика. Именно здесь масштабируемость ломается.

Представьте идеальный мир, где протокол однозначен, и, строго следуя ему, можно получить именно то, что хотелось. В лучшем случае его оптимизируют и поделятся со всеми остальными, чтобы они не ходили по одним и тем же граблям каждый раз в сотнях и тысячах лабораторий.

Я испытаваю это на себе. Как аутсайдер из теоретической физики, меня всегда удивляло, насколько много знаний в мокрой лаборатории являются неявными. Да, у нас есть написанные протоколы почти для всего. Однако для новичка одним из главных барьеров является именно то, что так много знаний остаются неявными, и без поводыря новичок будет раз за разом делать ошибки, прежде чем что-то заработает. Единственный разумный способ освоить протокол — либо наблюдать, как это делает кто-то другой, либо, ещё лучше, делать это самому под присмотром того, кто уже делал это раньше и знает как. Это тоже не масштабируется.

Это похоже на кулинарию — можно иметь идеально написанный рецепт, но без живого человека рядом (обычно это родственники, родители, супруги и т.д.) вы просто изобретёте свой новый рецепт, вдохновлённый написанным протоколом. Будет вкусно, но не как в оригинале! То же самое относится к протоколам в лаборатории.

Конечно, в идеальном мире робот выполнял бы всё, следуя набору чётких и однозначных инструкций. Если протокол написан на питоне, то ошибиться сложно. Но загвоздка в том, что реальный мир не написан на питоне. И что-то всегда идёт не так!

Даже у хорошо откалиброванного робота что-то может пойти не так — прежде всего, конечно, со временем калибровка дрейфует. Колебания температуры, влажности, кто-то случайно задевает робота и т.д. Но даже без этих факторов клеточная культура, с которой работаешь, не идеальна. Могут возникать ошибки пипетирования и т.д. Особенно при работе с малыми объёмами — если вы когда-нибудь пробовали пипетировать вручную или роботом 1 мкл ДНК в 384-луночную ПЦР-плашку, вы знаете, о чём я говорю. Физика жидкостей бесит — они вязкие, у них есть поверхностное натяжение, иногда они просто застревают на стенке, вместо того чтобы стечь на дно лунки. Физика — зло. Биология — ещё хуже. Пытаться решить плохо поставленную проблему с помощью сверхточной робототехники — глупая затея. Операции в мокрой биологии охватывают множество масштабов — от пипетирования 0,5 мкл жидкости до выливания литров воды в инкубатор. Конечно, можно использовать специального робота для каждой задачи, но физическое пространство в лаборатории быстро закончится.

Если вы знакомы с теоремами Гёделя, вы знаете, что «любая непротиворечивая, достаточно сложная формальная математическая система неполна» — протоколах мокрой лаборатории — это тоже «формальная математическая система». Она всегда будет неполной. Как бы усердно вы ни пытались формализовать и описать всё, биология найдёт способ всё для вас испортить. К тому же человеческий язык неоднозначен. «Казнить нельзя помиловать». Разделите ваши 100 тысяч клеток в отдельную пробирку. Как именно их разделить? Когда? До или после центрифугирования? В какую отдельную пробирку? 15 мл, 50 мл, 1,5 мл, 2 мл? Пробирки для белков или ДНК?

Не существует единого идеального мокрого протокола. Почему? Потому что человеку нужны ясность и скорость; чем длиннее инструкция, тем, парадоксально, менее полезной она становится. Хочется сжать её достаточно, чтобы вспомнить, какие шаги загрузить из механической памяти. Но чем подробнее описание, тем больше времени человеку нужно потратить на её чтение. Здесь есть компромисс между полнотой и скоростью. Конечно, у вас есть реальные дедлайны, и эксперименты нужно выполнять быстро. Нет времени документировать каждое исключение.

В разработке ПО концепция технического долга до боли знакома каждому. Да, мы можем выжать максимум и сделать всё к дедлайну. Придётся срезать углы, меньше документировать, меньше тестировать. Мы выигрываем в краткосрочной перспективе, но проигрываем в долгосрочной. Биология в целом систематически застряла в ловушке краткосрочного мышления.

Учитывая, что ИИ уже почти заменил сухих учёных, нам нужно подготовиться ко второму пришествию ИИ в мокрую лабораторию — да, потребуется несколько лет, чтобы сделать робототехнику достаточно хорошей для автоматизации лабораторий. Но что дальше? Как нам научить этих роботов выполнять наши мокрые протоколы вместо нас?

ИИ-агенты уже способны решать удивительно расплывчатые задачи и предлагать рабочие решения на основе плохо написанных и неоднозначных запросов. Нам нужно достичь того же уровня в физической мокрой лаборатории. Не пора ли перестать прятать наши лабораторные протоколы и начать с их открытия для совместного их улучшения?

Поделиться:

Давайте оставаться на связи

Подпишитесь, чтобы получать обновления о моей работе в области исследований долголетия и достижениях в области терапий, продлевающих жизнь и замедляющих старение.

обновлено 21-03-2026