Биоинформатика в борьбе с раком

Биоинформатик Андрей Афанасьев — один из основателей биотехстартапа yRisk. В интервью Андрей рассказал, какие технологии они используют, чтобы определить, есть ли у человека предрасположенность к наследственным формам рака, как дела с биотехнологиями в России и есть ли в биотехе работа для программистов.




Про yRisk

Андрей, ты — основатель генетической лаборатории yRisk, вы ищете мутации в генах и предрасположенность к онкологии. Расскажи, пожалуйста, как это происходит на практике?

Мы делаем тест на наличие так называемых наследственных опухолевых синдромов, это выражается в высоком риске заболеть раком в течение жизни в относительно молодом возрасте, даже до 50 лет.

Как мы проводим этот тест? Мы собираем у человека кровь из вены, как при обычном анализе крови, из этой крови выделяем ДНК, и ДНК анализируем на специальном приборе, называемом секвенатор. Из секвенатора получается довольно много данных, гигабайты и даже десятки гигабайт на один образец. Дальше мы их анализируем с помощью специальных алгоритмов, баз данных, рекомендаций по анализу этих данных и формируем многостраничный отчет, в котором рассказываем, есть ли повышенные риски относительно средних, и что с ними делать, если эти риски есть.

В этом интервью Андрей подробно рассказывает о наследственных опухолевых синдромах

Как это все устроено с точки зрения технологий? Как вы обрабатываете эти данные? У вас какое-то собственное ПО?

У нас был опыт написания такого ПО в моей прошлой компании, в стартапе iBinom. Мы делали облачный сервис для биоинформатической обработки данных секвенатора, и мы воспользовались накопленным опытом, чтобы эту обработку для себя реализовать.

В iBinom мы делали обработку в облаке, использовали Amazon S3 как хранилище, Amazon Elastic Computing Cloud как вычислительные ноды. Сейчас это все работает на локальном сервере, где мы разворачиваем набор биоинформатических программ.

Сначала анализируется качество входных данных, которые поступают с секвенатора. Есть специальная программа для анализа качества данных FastQC: с ее помощью строятся разные статистики, распределения и так далее.

Если с качеством на этом этапе все хорошо, то выполняются так называемые выравнивания данных — alignment, или маппирование, или картирование. Нет какого-то установившегося русского слова. Alignment — это тяжелая задача с точки зрения вычислений, она занимает довольно много времени для каждого образца.

После того, как данные откартированы, выполняется так называемый variant calling с помощью разных статистических алгоритмов. После этого найденные варианты аннотируются по всем доступным базам данных.

После аннотации получается большая экселевская табличка с вариантами и функциями. И в этой большой экселевской табличке мы уже глазами выбираем варианты, анализируя их по критериям ACMG (критерии Американского колледжа медицинских генетиков).

Этот анализ уже нельзя автоматизировать, нужно обращаться напрямую к публикациям, вчитываться в них. Если там написано одно, то ставится какая-то галочка, если другое, то, например, галочка не ставится. И так делается для каждого образца, несколько сотен записей надо просмотреть вручную.

И здесь уже машинное обучение не помогает, только ручная работа?

Да, здесь машинное обучение не работает, потому что статьи, которые написаны людьми, они написаны в человекочитаемом виде, а не в машиночитаемом. Мы пробовали играть в извлечение данных с помощью нейросетей, с помощью разных подходов к вытаскиванию смыслов из текста. Это мы делали в рамках лаборатории функционального анализа генома 3 года назад, но мы увидели, что никаких значительных продвижений тут не получается.

В биологии это вообще довольно важная история: данные не машиночитаемые, и сама разметка данных очень сложна. Ты не можешь просто нанять кучу людей, которые скажут, что здесь — котик, а здесь — собачка, здесь — светофор, а здесь — переход. Это должны читать люди, у которых есть хорошее биологическое образование.

Там есть попытки собирать автоматизированные базы, но как человек, который пользуется некоторыми из этих баз, я могу сказать, что качество там ужасное. Довольно часто люди, условно говоря, прочитали что-то в аннотации, как-то это поняли и написали, например, что вариант патогенный, хотя ты идешь в текст статьи и там прямым текстом написано, что он не патогенный. То есть ровно обратное. Поэтому тут заканчиваются возможности какой-то компьютерной обработки, и всю значимую информацию надо глазами искать.

На вашем сайте сказано, что точность теста 99,99%, и это звучит очень круто. Если этот текст настолько эффективен, почему его нельзя сделать в обычной больнице?

Этот тест требует оборудования — секвенаторов, секвенаторы до сих пор — это научно-исследовательские приборы, и тест, который мы делаем – научно-исследовательский.

Медицинские лаборатории не хотят связываться с научно-исследовательскими приборами. На это есть много причин: начиная от того, что они не могут получить возмещение по НДС, заканчивая тем, что они находятся под риском проверок Росздравнадзора за любые реагенты или приборы, которые не зарегистрированы как медицинские.

Тут история очень простая. Те тесты, которые являются медицинскими по закону, выполняются на старом оборудовании и на старых реагентах. Тесты, которые не являются медицинскими, не могут определенным образом продаваться и маркетироваться. Например, немедицинский тест нельзя закупить по государственным деньгам, на медицину выделенным, или нельзя покрыть ДМС.

Поэтому мы тут на переднем краю. Разговоры о том, чтобы такие тесты, как наш, на основе секвенирования нового поколения, делать медицинскими идут уже довольно давно, минимум года четыре. Но воз и ныне там.

А есть какой-то прогноз, когда это станет общедоступным?

Я не верю, что в России это когда-то станет общедоступным. Когда-то, наверно, станет, но не в ближайшем будущем точно. У нас министр здравоохранения говорит, что у нас эталонная система здравоохранения. У нас есть куча более насущных проблем, например, элементарный доступ ко многим препаратам. Если почитать, что пишут люди из фондов, то можно увидеть, что все ужасно в сфере лекарственного обеспечения.

Этот тест — это проблема белых людей. Когда у человека все хорошо, есть деньги, и он может пойти и еще и вот это сделать.

Есть ли у вас планы разработать что-то еще?

У нас есть планы, связанные с разными продуктами для планирования семьи, ведения беременности. Тут мы хотим работать в партнерстве с другими клиниками.

Мы делали исходный продукт, связанный с онкологией, в надежде, что он в России востребован, но за два года поняли, что востребованность нами была переоценена, и сейчас хотим переключаться на чуть-чуть другие продукты.

Лекция Андрея о существующих теориях старения, диковинных долгоживущих животных и фармацевтических препаратах, которые могут помочь человечеству справиться со старением

Про биоинформатику

Чем сегодня занимаются биоинформатики во всем мире? Какие самые прикладные задачи перед ними стоят?

Биоинформатиками обычно называют людей, которые решают какие-то прикладные вычислительные задачи для биологии. То есть задачи, которые стоят перед биоинформатиками — это задачи биологов.

Самые красивые научные задачи — это продвижение в понимании эволюции и в развитии теории эволюции. Потому что из данных сравнений геномных последовательностей можно много чего интересного вытаскивать про то, как шла эволюция видов, про определение родства одних видов и других, про разные вопросы о накоплении мутаций, про слабо-вредные мутации и так далее. Это, наверное, самое интересное, с точки зрения науки.

С точки зрения прикладных вещей, для чего биоинформатика сейчас используется, — это для анализа геномных последовательностей. Анализ геномных последовательностей — это задача либо наследственных заболеваний, либо онкологических. Анализируются данные геномов людей, которые страдают наследственными заболеваниями, для того, чтобы устанавливать диагноз, для того, чтобы разрабатывать лечение, для того, чтобы понимать, насколько часто это встречается. Это одна задача.

Вторая задача — онкологическая. Анализируются данные геномов опухолей в попытках понять, какие там есть мутации драйверные, какие пассажирские, на какие мутации можно разрабатывать новую терапию, как идет эволюция опухоли, какое разнообразие опухолей бывает.

Третья вещь, которая есть – это популяционная геномика. Это попытка разобраться, насколько генетически мы разные, какие есть особенности у разных популяций и что с этим всем делать.

Какое недавнее открытие в биоинформатике тебя особенно впечатлило?

Сложно говорить именно про открытие в биоинформатике, потому что это чаще всего работы на кончиках пальцев. Скажу более приближенную к реальности вещь, потому что научные вещи вряд ли будут сильно интересны.

Была интересная работа Снайдера по биоинформатическому анализу микробиома своего организма в течение года. Почти каждый день он измерял, как меняется его микробиом, и опубликовал данные этого разброса. Он менялся в течение года довольно сильно.

С тех пор можно ждать популяционных микробиомных данных. Очень интересно, насколько микробиом у разных людей отличается не в течение года, а между друг другом в зависимости от места жительства, образа жизни и тому подобное.

Как биотехнологии развиваются в России?

Про это я могу говорить только хорошо или никак :) В широком смысле в России кое-что происходит. В медицинской стороне, конечно, тоже кое-что происходит, но это несравнимо меньше и медленнее, чем то, что происходит в Штатах. Почему? Давайте по-честному, потому что российская медицина маленькая и отсталая.

Разработки собственных лекарств у нас практически нет. Максимум, что мы делаем, это дженерики и биосимиляры. Оригинальные препараты российской разработки почти все — это фуфломицины, не имеющие нормальных подтвержденных доказательств эффективности. Конечно, тут все довольно грустно.

Мы как изолированный медицинский рынок очень маленькие, у нас тут особой движухи нет. Тем не менее, у нас есть разные интересные компании на стыке IT и биотеха. Почему они есть? Потому что у нас есть много хороших айтишников, и айтишники стремятся в биотех. И когда они понимают, что очередной убер для зубных врачей почему-то не взлетает в России или очередная электронная медицинская карта, то иногда им приходят в голову идеи и получше.

Мне очень нравится компания UNIM. Они сделали довольно простую вещь: они оцифровали гистологию. Все раковые диагнозы подтверждаются гистологическим исследованием. Гистологическое исследование — это когда берутся клетки, красятся специальным образом и разглядываются в микроскоп. UNIM эти картинки с микроскопа оцифровал в хорошем разрешении, с зумированием и с облачным хранением.

И теперь гистологический срез смотрят не в микроскоп, а на экране компьютера, и не один врач, а три. И не просто врач, который получил сертификат врача, а который еще и прошел внутреннее обучение в компании UNIM и сдал экзамены, независимо от государственных. Это все резко поднимает точность диагностики.

Это не очень сложная с точки зрения технологий вещь, а польза мощная и классная. Хотя хранить большие картинки тоже довольно сложно, но никаких чудес machine learning тут нет.

Можешь привести еще какие-то примеры российских биотехнологических проектов, которые тебе нравятся?

Мне нравится, что делают ребята в Атласе. Они делают генетические тесты. Исходная идея у них такая — сделать частную клинику, в которой решения будут еще и опираться на данные генетического тестирования. Изначально они зашли с неправильной технологией генетического тестирования, взяли микрочиповое тестирование — из этих данных мало медицински значимой информации можно получить.

Как правило, цифровые продукты в медицине в России — это что-то не технологичное, банальное, простое. У Станислава Сажина есть старая добрая социальная сеть для врачей. Понятная история, потому что фармкомпаниям нельзя рекламировать рецептурные препараты просто так в интернете, и они могут рекламировать только для врачей. И вот ты делаешь социальную сеть, в которой может зарегистрироваться только врач, приложив копию своего диплома. И там ты можешь крутить рекламу фармкомпаний. И у него все хорошо. Коммерчески это, наверно, одна из самых успешных компаний в цифровой медицине. Но дух не захватывает, когда мы говорим об этом.

Или сервис Zoon — маркетплейс для медицинских услуг. Нормальная диджитал-история: лаборатории и клиники постят свои описания и так далее. Это помогает генерить лидов, но опять же, дух не захватывает.

Подробная лекция о том, какие биоинформатические компании сейчас есть в России и мире

Конечно. Кому-то ведь нужно строить инфраструктуру для запуска всех этих наших биоинформатических софтов. Кому-то нужно писать новые биоинформатические софты.

Есть несколько подходов. Первый: брать биолога и учить его программировать, второй: брать информатика и учить его биологии. Ну и третий: брать человека и учить его и биологии, и программированию. Тут история такая, что если ты берешь биолога и учишь его программировать, то далеко не всегда получается нормальный результат. Если ты берешь программиста и учишь биологии, то ты на самом деле учишь его анализу данных, и он быстро уходит в data science на высокооплачиваемое место.

Надо честно сказать, такого уровня зарплат, как в IT, нет нигде. Везде будут зарплаты ниже. И в биоинформатике тоже зарплаты ниже, чем просто в анализе данных для диджитала какого-нибудь. И это, конечно, проблема, потому что куча людей, куча моих друзей-биоинформатиков поработали, убедились, что получают какие-то копейки, и уходили назад в IT. Тут конкуренция не выдерживается. Люди обычно идут по каким-то идейным соображениям, но долго на этих идейных соображениях не высиживают.

Если какой-то разработчик решил, что тоже хочет помогать в борьбе с раком, то что ему делать, куда идти? Или не идти никуда?

Ну, он может пойти поработать над распознаванием изображений, пойти поработать над анализом данных, получить интересные скиллы и опыт. Крупных компаний тут нет, поэтому это все равно будет какой-то стартап. Если надоест или зарплата покажется маленькой, всегда сможет вернуться назад.

Про популяризацию науки

Ты один из популяризаторов биоинформатики. Как и почему ты начал этим заниматься?

Начал этим заниматься, потому что мне это нравится. Нравится выступать, нравится рассказывать, разговаривать с аудиторией, доносить какие-то свои идеи. Мне это приятно, поэтому я этим занимаюсь.

Начал я с Science Slam в 2014 году, ребята позвали меня выступить и сказали, что после этого твоя жизнь изменится и не будет такой, как раньше. Не обманули :)

Они молодцы, что дают начинающим спикерам сразу оказаться в максимально доброжелательной и разогретой классной аудитории. Это цепляет, и после этого хочется продолжать выступать.

То самое выступление на Science Slam, с которого началась любовь к популяризации науки

Чувствуешь ли ты, что интерес к этой теме растет?

Мне кажется, да. Вещи, связанные с обучением и развлечением — они, конечно, сильно на подъеме. Это заметно и по числу курсов, которые я и мои друзья проходят, и по количеству лекториев, которые есть, и по количеству людей, которые зовут меня выступить.

Когда это начиналось, мне казалось, что это какая-то нёрдовая тема, а сейчас я вижу, что это совершеннейшим мейнстрим. Люди с удовольствием ходят и задают вопросы. Я сам люблю учиться через общение с людьми, книжки читать я тоже люблю, но быстро въезжать в тему лучше всего в каком-то человеческом контакте. И я очень рад, что все это развивается.

Потихоньку складывается можно сказать даже рынок научпопа. Это перестает быть занятием для аспирантов в свободное время.

Часто ты выступаешь не в Москве?

Конечно! Я постоянно и с большим удовольствием выступаю в разных городах. Только в этом году я выступал в Нижнем Новгороде, Твери, Екатеринбурге, Красноярске, Санкт-Петербурге, Новосибирске, в городе Плёс. За последние несколько лет это еще и Мурманск, Челябинск, Тюмень, Братск, Саяногорск, Владивосток.

Как дела с популяризацией в регионах?

То есть эта тема уже далеко не только московская, эта тема в регионах двигается, причем двигается с совершенно разных сторон. Я часто сотрудничаю с любимыми мной информационными центрами по атомной энергии — ИЦАЭ, это росатомовский проект про популяризацию науки. То есть он не про то, чтобы популяризировать атом и достижения атомщиков, они зовут вообще всех, устраивают фестивали науки, ну и, между делом, показывают, что корпорация Росатом — она за добро. Это, по-моему, один из хороших примеров корпоративного проекта.

Ну, и во многих городах есть свои локальные люди, которые это все организуют и продвигают. Например, очень классное сообщество в Твери, они даже журнал начали выпускать. В Екатеринбурге есть прекрасный Ельцин-центр, в котором куча событий происходит, там тоже весь научпоп собирается.

В общем, запрос есть, востребованность моя как лектора есть, и я очень рад, что во всех регионах какой-то движ идет.

24 января Андрей выступит на конференции о связи IT и науки Mieloconf. Андрей расскажет, что на самом деле можно узнать из генетического теста и как выглядит работа с данными в генетике.


Летняя школа по биоинформатике-2018

Денис Разбицкий, Уральский Федеральный Университет (УрФУ), г. Берёзовский

Проект имел упрощенную постановку задачи (допускались только две мутации: делеция и дупликация), однако, даже несмотря на это, задача оказалось непростой. На семинарах нам рассказали о генерации выборок с помощью статистического метода Monte-Carlo Markov Chain (МСМС), который мы использовали при работе над нашим проектом. Также я слышал о том, что подобную задачу решают с помощью деревьев принятия решений (decision trees) – семейства алгоритмов машинного обучения. Большую часть времени мы провели у доски – нужно было систематизировать наши мысли, рассмотреть разные варианты, проверить их состоятельность. Затем мы начали программировать, однако из-за временного лимита нам пришлось ограничиться только некоторыми статистическими подсчетами. Несмотря на то, что у нас было не так много времени, мы получили интересный и полезный опыт, а также применили знания, полученные на семинаре по MCMC.


Летняя школа по биоинформатике-2018

На самом деле, работ и исследований в области рака сегодня очень много. Так, активно исследуются иммунотерапия рака, онкогеномика, а также персонализированная онкология. Я выбрал этот проект, потому что мне хотелось попробовать применить знания теории вероятностей и математической статистики к решению прикладных задач, и, как мне кажется, нашей команде это удалось.

Елена Картышева, математико-механический факультет СПбГУ


Участники Летней школы-2018

Сначала мы не знали, как разрешить проблему, однако позже решили свести ее к задаче бинарной классификации. В этом случае мы просто обучаем модель и смотрим, какие признаки являются самыми важными. Мы немного поработали с данными, хотя преобразование мало что дало: у нас была разреженная матрица данных. В итоге из большого числа разных моделей самый лучший результат дал catboost от Яндекса – его мы и использовали. Дальше уже шла работа с визуализацией и анализом полученных результатов.

Летнюю школу по биоинформатике организует Институт биоинформатики с 2013 года. В интенсиве ежегодно участвуют 100 студентов, аспирантов и молодых учёных физико-математических, компьютерных и биологических специальностей. В этом году в течение шести дней участники слушали лекции про молекулярную биологию и генетику, биоинформатику и ее применение в диагностике и изучении рака, узнали, как научные группы мира объединяют свои усилия в изучении геномики и эпигеномики рака и многое другое. Полученные знания участники школы сразу применяли на практических занятиях по обработке данных на языке Python и в статистической среде R, построению пайплайнов и моделированию белковых молекул, а также узнали про визуализацию полученных данных, построение карьеры в биоинформатике и подготовку научного резюме. Среди приглашенных лекторов были учёные из России, такие так Алла Лапидус (Центр алгоритмической биотехнологии СПбГУ), Михаил Пятницкий (НИИ биомедицинской химии им. В.Н. Ореховича), Алексей Сергушичев (Университет ИТМО), а также представители биоинформатических лабораторий из университетов Европы и США: Константин Зайцев (Washington University in St.Louis, Университет ИТМО), Герман Демидов (Barcelona Institute of Science and Technology/ Universitat Pompeu Fabra), Константин Оконечников (German Cancer Research Center), Павел Синицын (Max Planck Institute of Biochemistry), Илья Минкин (The Pennsylvania State University) и другие.

Каждый год школа совершенствуется. Сначала все проекты были обязательными и длились в течение всей школы, сейчас кураторы перешли к формату хакатона с короткими проектами для всех желающих, которые являются продолжением практик. Каждый проект выполняется командой биологов и информатиков.


В этом году на летнюю школу было подано более 450 заявок из России и стран ближнего и дальнего зарубежья. Среди отобранных на два равных потока участников — биологов и информатиков — представители пяти стран (Россия, Украина, Белоруссия и другие) и 30 городов, среди которых Алматы, Владивосток, Архангельск, Нижний Новгород, Челябинск, Уфа и другие. Организаторы школы отбирают участников, руководствуясь несколькими критериями: анкета, резюме и тезисы. Во внимание принимаются мотивация, соответствие профилю и уровню школы, академические и научные достижения и другие заслуги, интеллектуальный уровень заявки. Школа ориентирована на начальный уровень знаний в биоинформатике.


Загадка происхождения жизни

Биоинформатика — это диджитализация биологии. То есть это не только наука о последовательностях ДНК и белков, но и изучение биологии при помощи компьютера. Когда мы вглядываемся в биологию не с помощью микроскопа или пипетки, а понимаем биологию через измерения. Можем оформить их на компьютере в виде таблиц и начать анализировать. Биоинформатика — это числа, которые возникают в биологии, на них можно смотреть взглядом физика-теоретика или математика.


Когда появляются огромные массивы данных, то возникают вопросы, о которых люди 50 лет назад и представления не имели. Биоинформатика — это еще и способ изучения биологии, рождающий собственные вопросы. Многие рассматривают ее как нечто прикладное, необходимое для ответа на старые вопросы, поставленные биологами 50 лет назад.

Загадка происхождения жизни раскручивается с помощью биоинформатики. Экспериментально эволюцию трудно организовать. Как в астрономии: чем дальше смотрим, тем более ранние стадии существования Вселенной видим. Так же и в биоинформатике: чем больше данных собираем о последовательностях, тем дальше можем заглянуть вглубь, представить, как выглядел первый организм LUCA (Last Universal Common Ancestor), и это, безусловно, меня вдохновляет.

Вычислительный аватар пациента

Модель виртуального пациента не должна обладать сознанием, она должна просто отвечать на вопросы. Какой прогноз будет у пациента с определенным геномом и видом опухоли, если воспользоваться конкретным лекарством? А если стандартное лекарство к нему не подходит, то какое лучше применить? Когда мы говорим о виртуальном пациенте или вычислительном аватаре пациента, это не является чем-то фантастическим и непредставимым. Конечно, это вопрос десятков лет. В нем важно учитывать данные, набранные в эру геномики, которая существует от силы лет 30.


Шрада Агарвал, Outcome Health: когда человек знает о своей болезни, от этого выигрывают и он, и фарма

Абстрактные модели клетки, описывающие ее с помощью десятков переменных, — предел человеческого мышления. Когда мы начинаем изучать не десять взаимодействующих переменных, а сотни, мозг уже не справляется. Поэтому нужно автоматизировать логическое мышление. Но автоматизация логического мышления — это автоматизация позапрошлого дня. Такие экспертные системы существовали в 60–70-х годах. Проблема в том, что знание должно быть предварительно в них заложено в виде логических цепочек, но для достаточно сложных систем нет такого знания. Задача ИИ сегодня — на основе данных выстраивать цепочки, по которым может дальше идти автоматическое логическое размышление.

Машинное обучение и лечение рака

Биоинформационные данные в первоначальном виде — это облако точек в многомерном пространстве. Оно не несет в себе никакой логической схемы. Машинное обучение — основной инструмент любого биоинформатического анализа, начиная с представления геометрического облака данных и заканчивая поиском связей между его характеристиками. Облако может репрезентировать пациентов участвующих в клиническом испытании или клетки опухоли одного из них, а машинное обучение связывает положение точки внутри этого облака с фенотипом или с некоторой меткой — например, какой формой рака человек болеет и на какой стадии развития находится болезнь.

Успех нейронных сетей сегодня связан с распознаванием изображений — извлечением некоторых числовых характеристик. Это применяется в биологии рака: у вас есть множество маммографий, результатов скрининга, а нейросеть может отличить, на какой из маммографий присутствует раковая опухоль и на какой стадии. Раньше задачей гистопатолога было разглядывать эти изображения и маркером обводить определенные типы клеток, чтобы сделать прогноз о том, будет ли рак агрессивным. Сейчас при помощи нейросетей это легко автоматизируется. Потенциально нейросети можно применять к данным другого рода — данным биохимии, но все приложения, существующие в этой области, по-прежнему наивны.

Идея карты сигнальных путей заключается в попытке нарисовать схему биохимии раковой клетки в виде двумерной карты. Наша группа делает это не для всей биохимии, а для тех ее аспектов, которые ведут себя по-другому, когда возникает рак. Этот проект начали 12 лет назад. Первая карта, которую мы построили, была картой клеточного цикла — основной характеристики раковой клетки. Раковая клетка делится чаще, чем нормальные, это связано со свойством клеточного цикла. Эту карту можно было напечатать на листе A4, она уже была достаточно сложной, но сравнительно маленькой. Сейчас карты стали напоминать схемы, диаграммы, которые мы смотрим с помощью движка карт Google Maps.

Мы превращаем вопрос, который существует у биолога, в идею некоего алгоритма или серии алгоритмов. Чаще всего это не новый алгоритм, но набор вычислительных методов, составленных в наиболее оптимальном порядке для данной задачи. А по пути возникают вопросы и из системной биологии, вопросы уже не биологические, а методологические. Команда, которую я курирую, занимается вычислительной биологией рака. Мы не занимаемся экспериментами и постановкой биологических задач. Но при этом много сотрудничаем с людьми, генерирующими омиксные данные.


Чтобы понять, как лечить рак, нужно разобраться, как устроено живое. Нужно понять более фундаментально саму биологию. Это более научно ориентированный подход. В краткосрочной перспективе он далек от капитализации и конкретных выводов. Но в долгосрочной может привести к совершенно новым, радикальным подходам к лечению рака. Но есть и такие центры исследования, которые придерживаются прагматического подхода. В них исследуют, какое лекарство лучше для конкретного типа рака. Они заточены на сборе информации о том, как те или иные лекарства действуют на пациентов. На этом основании они делают очень прагматические выводы об эффективности лекарства.

Забыть, откуда рак происходит, с точки зрения медицинского подхода — это революция. Она связана с биоинформатикой и появлением омиксных технологий. Самые современные исследования не смотрят на тип рака. Им не интересно, это рак груди, почки или пищевода. Они смотрят непосредственно на геном раковых клеток, на молекулярные профили, пытаются разработать стратегию лечения. Это происходит на основании знаний о том, какие мутации появились, на какие мутации можно воздействовать для лечения рака. Это очень современный подход в лечении.

Неперсонализированная медицина — это то, что мы делали 30 лет назад. Тогда пациент приходил с формальным диагнозом — например, рак груди на такой-то стадии, локализирован там-то. На основании такого простого описания, не вдаваясь в молекулярные маркеры, опухоль удаляется, а затем применяется химиотерапия. Базовое оружие — химиотерапия, которая может действовать или нет.

Сейчас персонализированная медицина — это стандарт лечения. Если в диагнозе находятся молекулярные характеристики из определенного репертуара, то назначается конкретный препарат. Проблема в том, что этот репертуар сегодня очень ограничен, а вероятность назначения персонализированного лекарства не так высока. Это связано с тем, что при диагнозе не используется большинство маркеров. Применяются лишь самые частые, которые покрывают несколько десятков процентов случаев. Задача прогресса в этой области — увеличивать репертуар этих маркеров. Так появится больше возможностей покрыть не 20%, а 80% случаев. Разработка тестов биомаркеров гораздо ближе к биоинформатике, которой мы занимаемся.

Мы кладем биомаркеры на стол, и потом совершенно неизвестно, что с ними происходит. В целом открывают их много. Может, их существует больше, чем нужно. В каждом проекте такой биомаркер так или иначе возникает. Вопрос в том, как быстро удается внедрить новый биомаркер в практику. Это уже вопрос о сотрудничестве с компаниями, которые могут эти биомаркеры хоронить с точки зрения конъюнктуры.

Наша работа не выстроена так, чтобы завтра внедрить новое лекарство. Есть возможный сценарий: к нам приходят биологи, они приносят свои данные. Мы их анализируем, на основании этих данных возникает идея о том, как определенный тип рака лечить. Под эту идею подбирается конкретное лекарство. В каком-то смысле мы играем в более долгую перспективу.

Научный мир не заинтересован в прибыли. Ученый не должен думать, как капитализировать свои исследования. Ученый никому ничего не должен. Биоинформатика может приносить прибыль через сотрудничество с фармацевтическими компаниями. В этом случае компании, осваивая наши технологии, выставят их на рынок. Ученый зачастую не имеет ни образования, ни желания, ни возможности выставлять что-то на рынок. Максимум, что ученый может — получить патент на свое изобретение. Потом эти патенты могут использовать фармацевтические или технологические компании.

Научный метод может быть похоронен с точки зрения внедрения. Например, мои коллеги из Института Кюри (кстати, одна из них из Красноярска) разработали метод диагностирования рака груди. Биотехнологическая компания купила их патент за полмиллиона евро. Но не для того, чтобы внедрять. Компания просто скупила множество патентов, исходя из своей рыночной стратегии. Поскольку есть монополист на такие вещи, он может по своим соображениям часть этих методов просто закрыть, даже если они более информативны с точки зрения диагноза

Если идея будет в открытом доступе и не лицензирована, никакая компания не начнет ее внедрять в практику. Все фармацевтические компании на данный момент заинтересованы в монополии на идею. Когда компания покупает патент, у нее есть 20 лет, чтобы отбить лекарство с точки зрения всех вложений. Ей нужно вложить до миллиарда евро, чтобы какой-то блокбастер выпустить. 20 лет будет монополистом на рынке, а потом — можно делать дженерики. Соответственно, если есть знание об идеальном лекарстве, которое нельзя купить и стать монополистом, то никакая компания не будет заинтересована вложить миллиард евро в это дело. Ведь тем же займутся в Индии или Китае, придется конкурировать.

Раньше считалось, что главная задача в лечении рака — убить раковую клетку, и люди научились это неплохо делать. Исследование нобелевских лауреатов американца Джеймса Эллисона и японца Тасуку Хондзё — новая методика иммунотерапии раковых заболеваний — важно, поскольку с ним связаны сегодняшние надежды с долгосрочным лечением рака. За последние пять-десять лет в понимании рака произошла концептуальная смена представлений. Начиная от химиотерапии, которая значительно улучшилась, и заканчивая таргетной терапией, которую мы применяем сегодня.

Главная проблема — это проблема рецидива. 100% раковых клеток все равно нельзя убить. Даже если остается несколько, вырастает новая опухоль, которая уже старыми лекарствами не лечится. Новые лекарства становятся все эффективнее, но война все время проигрывается за счет рецидива.

Люди стали верить, что долгосрочное лечение рака обеспечивает реакция иммунной системы. Надо понимать, что в каждом из нас сидят десятки микроскопических раковых опухолей, которые при желании можно обнаружить. Они не дают видимой опухоли, потому что контролируются иммунной системой. На первое место в лечении рака встали вопросы, как иммунные клетки взаимодействуют с раковыми, в каких случаях раковым клеткам удается обмануть иммунную систему, а в каких случаях — нет. Если у них получилось, то как можно усилить реакцию иммунной системы на раковую опухоль.

Эллисон и Хондзё с точки зрения фундаментальной биологии использовали то, что было известно до них. Но научились контролировать ответ T-клеток, усиливать этот эффект, а точнее, подавлять их. В основе этой работы есть двойное отрицание: они научились подавлять ингибиторы клеток. Основной ответ на раковые клетки происходит через T-клетки, именно они реагируют на присутствие раковой опухоли своим размножением. Но в размножение сразу встроен тормоз — так устроены все процессы в иммунной системе. Поэтому у нас и есть проблема аутоиммунных заболеваний. Вопрос в том, как этот тормоз локально убрать, чтобы раковая опухоль не могла остановить размножение T-клеток.

Не думаю, что можно предсказать, как будет вести себя смертность. Важно понимать, почему заболеваемость раком растет. Есть минимум четыре аспекта. Первый и самый главный аспект — население стареет. Второй — диагностирование рака. У нас более чувствительные технологии, которые позволяют продиагностировать больше случаев. Третий — окружающая среда, хотя о ее влиянии мы знаем очень мало. К примеру, японцы почти не болеют раком груди, но чаще болеют раком пищевода. И это связано не с генетикой, а с тем, что они едят. Четвертый аспект спорный — генетика. Генетика человечества меняется, возможно, в ней накапливаются отрицательные мутации. Те из них, которые приводили раньше к смерти, теперь можно лечить, тот же рак. Тем не менее, прогресс в лечении рака очевиден. Посмотрите статистику долгосрочной излечиваемости рака — она очень впечатляющая. Такие распространенные типы заболевания, как рак груди, мочевого пузыря или простаты сейчас излечиваются с вероятностью до 90–95%. Сегодня диагноз рак груди — это вовсе не приговор, а такое же заболевание, как и остальные, хотя и очень опасное. Конечно, если посмотреть на всю таблицу, типов рака очень много, по некоторым из них выживаемость практически нулевая. Но это не масса, а, как правило, редкие типы. Сейчас люди серьезно борются с детским раком. Их задача — снизить смертность от педиатрических раков до нуля. Я думаю, это реальная перспектива в ближайшие 15 лет.

Ситуация с доступностью новых технологий лечения рака в различных регионах через 15 лет будет отличаться сильнее, чем сейчас. Многие столкнутся с тем, что болезнь детектирована, лекарства для нее есть, но где взять денег на лечение, непонятно. Это и сейчас очень актуально, а через 15 лет проблема будет стоять еще острее, поскольку дорогих лекарств и способов лечения будет гораздо больше. Можно надеяться на то, что проблема социально значимых типов рака, например, детских раков, будет решена в благополучных странах. Но мы не можем сказать, что через 15 лет рак уйдет. Всегда будет оставаться длинный хвост экзотических и агрессивных типов рака, к которым мы до сих пор не знаем, как подступиться.

Конкуренция в научном мире идет за Нобелевские премии, количество статей в хороших журналах и патенты. Последняя Нобелевская премия, которая России приписывается, — это премия Гейма и Новоселова, но они уже давно не российские ученые. А реальные награды в последний раз давали российским ученым еще за советские проекты. Пока в этом плане Россия не конкурентоспособна. За статьи, в общем, тоже. Если посмотреть валовой продукт научных публикаций, картина не будет очень радужной. С одной стороны, видно, что многие талантливые ученые разъехались, а с другой, есть очаги науки, великие ученые, до сих пор работающие в России, то есть все не безнадежно. Меня всегда очень поражают молодые ребята, которые приезжают из Сколтеха. То, что происходит там в плане биоинформатики, очень динамично и конкурентоспособно.

Читайте также: