Важнейшим показателем опасности инфекционного заболевания является коэффициент смертности (КС) — доля умерших от общего числа заразившихся. Первые оценки коэффициента смертности от коронавируса (COVID-19) были устрашающе высоки и привели к появлению апокалиптических прогнозов развития пандемии, которые, вероятно, повлияли на введение масштабных ограничительных мер, вызвавших бурную общественную дискуссию. В связи с этим очевидна острая необходимость получения надежных данных о тех рисках, которые несет заражение коронавирусом. Исследование известного американского эпидемиолога, специалиста по анализу данных и гуру доказательной медицины Джона Иоаннидиса, недавно принятое к печати в выпускаемом ВОЗ Международном журнале общественного здравоохранения, обобщает данные нескольких десятков работ, в которых оценивались распространенность и опасность COVID-19. Полученные результаты говорят о весьма умеренной угрозе, которую несет вирус для людей в целом (КС = 0,23%) и людей трудоспособного возраста (моложе 70 лет) в частности (0,05%). Еще одна приятная новость заключается в том, что и эти данные об опасности коронавируса, возможно, завышены. Кроме того, в исследовании приводится оценка общего числа людей, переболевших COVID-19, включая бессимптомные случаи, позволяющая оптимистичнее взглянуть на возможность достижения коллективного иммунитета.
Плохое начало
Нынешняя пандемия, вызванная коронавирусом SARS-CoV-2, показала необычайно высокую готовность эпидемиологов строить прогнозы ее развития и, увы, крайне низкую точность подобных предсказаний. В статье с красноречивым названием «Попытки предсказать развитие пандемии COVID-19 закончились провалом» (J. Ioannidis et al., 2020. Forecasting for COVID-19 has failed), опубликованной в августе 2020 года в International Journal of Forecasting, приводится множество примеров неудачных прогнозов, сделанных зачастую весьма почтенными специалистами, в том числе и самими авторами статьи (среди которых всё тот же Джон Иоаннидис). Часть этих предсказаний производит сейчас, всего несколько месяцев спустя после того, как они были сделаны, довольно странное впечатление. Так, некоторые модели предсказывали 100 миллионов заболевших в одних только США спустя четыре недели после начала эпидемии и 40 000 больных, требующих реанимационного ухода в одном только Нью-Йорке. В обоих случаях реальные цифры оказались ниже на порядки.
Сделавшая ранний и очень известный прогноз группа эпидемиологов из Имперского колледжа Лондона исходила из того, что пандемия коронавируса сравнима по масштабу с пандемией испанского гриппа, унесшей в 1918–1920 годах жизни более 50 миллионов человек при населении Земли менее двух миллиардов, средний возраст которых составлял 28 лет (см. Report 9 — Impact of non-pharmaceutical interventions (NPIs) to reduce COVID-19 mortality and healthcare demand). Заметим, что по состоянию на октябрь средний возраст жертв коронавируса примерно 80 лет (см., например, октябрьский отчет Национальной статистической службы Великобритании), а число жертв после почти уже года эпидемии в 40 раз меньше при почти восьмимиллиардном населении планеты (данные с сайта worldometers.info). И все бы ничего, если бы на основании неудачных предсказаний ученых не принимались важнейшие решения.
Группа ученых в своей статье-манифесте Five ways to ensure that models serve society: a manifesto, опубликованной в июне в журнале Nature, трезво замечает: «Сейчас нет ни одного аспекта пандемии, относительно которого ученые могут сделать точные и надежные предсказания. Известные неизвестные включают в себя распространенность вируса, а также его коэффициенты смертности и воспроизводства. …> Еще меньше мы знаем о сезонности инфекций, работе иммунитета и влиянии социального дистанцирования на передачу инфекции. …> Модели дают крайне ненадежные оценки будущего числа зараженных, госпитализированных и умерших людей. Вместо того, чтобы использовать модели для улучшения своего понимания происходящего, политики использовали их как оружие для поддержки уже давно сформированной повестки.» („Yet there is no substantial aspect of this pandemic for which any researcher can currently provide precise, reliable numbers. Known unknowns include the prevalence and fatality and reproduction rates of the virus in populations. …> We know even less about the seasonality of infections and how immunity works, not to mention the impact of social-distancing interventions in diverse, complex societies. …> Mathematical models produce highly uncertain numbers that predict future infections, hospitalizations and deaths under various scenarios. Rather than using models to inform their understanding, political rivals often brandish them to support predetermined agendas.“)
Разумеется, никто из авторов манифеста не призывает отказаться от моделирования эпидемий. Они лишь предлагают ученым не завышать ожиданий от надежности своих предсказаний, чтобы не стать заложниками политической игры, больше думать о научной и этике и… просто быть скромнее.
У неудачных прогнозов было много причин. Но кроме сложности самой задачи Иоаннидис с коллегами называют в числе причин также шаблонное мышление и стадное чувство (groupthink and bandwagon effects), заставлявшие ученых подгонять свои модели под ожидания испуганной широкой публики и власть имущих (см. J. Ioannidis et al., 2020. Forecasting for COVID-19 has failed). Основная же причина, которая делала предсказания заведомо ненадежными, — недостаток данных о коронавирусе в начале пандемии и крайне некритичное отношение к тем данным, которые имелись в наличии на тот момент. Хочу отметить, что и удачные предсказания страдают теми же недостатками и в отсутствие надежных знаний о коронавирусе, скорее, свидетельствуют о везении авторов, чем о совершенстве их моделей.
Одной из важных как для матмоделистов, так и для нас с вами характеристик вируса, необходимых для адекватного прогнозирования и понимания масштаба эпидемии, является коэффициент смертности (КС) (infection fatality ratio), под которым, по определению ВОЗ, понимают долю умерших от общего числа заразившихся лиц. Отдельно подчеркну: не от числа тех, у кого было «официально» диагностировано заболевание, а от всех заболевших, многие из которых не попали в сферу внимания медслужб.
Первые опубликованные данные о КС коронавируса (до 3,4%) наводили на пессимистичные мысли: одни люди всерьез воспринимали цифры, потенциально грозящие гибелью нескольким процентам населения Земли, а другие опасались, что публикация подобного рода непроверенных данных может вызвать панику и надолго подорвать престиж доказательной медицины. Прогнозы, построенные на таких данных, были апокалиптичны, но, по счастью, далеки от реальности. С ходом времени растет и число доступных данных о пандемии, и качество этих данных: теперь мы знаем гораздо больше о реальной опасности коронавируса и можем опираться на эти знания с куда большей уверенностью.
Один из авторов уже упоминавшейся работы, а также автор одной из самых цитируемых научных работ современности (см. о ней новость Каждая вторая научная работа не имеет ничего общего с реальностью, «Элементы», 03.09.2005) Джон Иоаннидис, подготовил недавно статью, в которой проведен анализ многих массовых исследований, ставивших целью оценить КС коронавируса. Сейчас она принята к печати в выпускаемом ВОЗ Международном журнале общественного здравоохранения. В последние месяцы Иоаннидис существенно разошелся во мнении с влиятельными представителями научного и политического истеблишмента относительно мер по сдерживанию пандемии коронавируса и подвергся атакам со стороны ряда СМИ и некоторых ученых. Я хочу предупредить читателей об этих досадных обстоятельствах и подчеркнуть, что нет никаких оснований считать справедливой обрушившуюся на Иоаннидиса волну критики.
Статья, о которой я собираюсь рассказать, не является непосредственно результатом экспериментального исследования. Она подытоживает результаты многих других экспериментов и наблюдений. Другими словами, она метааналитическая, и, чтобы рассказать о выводах, сделанных в этой статье, я должен вначале подробно объяснить, что такое метаанализ и какие подводные камни он в себе таит (о метаанализе применительно к COVID-19 рассказано и в новости Генетический вариант, повышающий риск тяжелого протекания COVID-19, унаследован от неандертальцев, «Элементы», 05.10.2020). Это потребует некоторого времени, и нетерпеливые читатели могут пропустить часть текста, посвященную тонкостям метаанализа, и сразу перейти к разделу «Возвращаясь к коронавирусу. Что изучали?».
Метаанализ: в идеальном мире
Греческая приставка «мета-» (μετα-) имеет значения «за», «сверх», «над», «после», подчеркивающие выход на новый уровень обобщения или абстракции. Скажем, метаданные — данные о данных, а метапопуляции — это своего рода сверхпопуляции или популяции популяций (подробнее о них читайте в новости Изолированные популяции подорожника хуже справляются с паразитическим грибом, «Элементы», 24.03.2020). Ну а метаанализ — это анализ анализов или, говоря чуть менее вычурно, набор подходов, призванных обобщить статистическими методами результаты нескольких (а лучше, если — многих) исследований.
Допустим, вы решили узнать, к чему пришла биология в таком важном теоретическом вопросе, как влияние уровня половых гормонов в организме животного на работу его иммунитета. Я не шучу: такой вопрос действительно задавался, причем не раз (см., например, новость Домашние канарейки не поддержали теорию полового отбора, «Элементы», 26.04.2017 и статью Y. Zhi Foo et al., 2016. The effects of sex hormones on immune function: a meta‐analysis). Он связан со многими теоретическим построениями в эволюционной биологии, а также с практическими приложениями в медицине и, разумеется, в животноводстве. Если вы взглянете на отдельные работы по этому вопросу, то выясните, что их результаты часто противоречат друг другу. Это происходит, например, в силу различий в методиках исследований и/или даже элементарной случайности. Как же докопаться до истины?
Первая идея, которая приходит в голову, — решить вопрос элементарным голосованием. Если в большинстве работ половые гормоны подавляют иммунитет, то так тому и быть. Но у этого подхода есть недостатки. Так, научные работы могут быть очень разными. Что должно перевесить: десять работ с очень ненадежными оценками статистических параметров, сделанных на малых выборках, или два масштабных исследования, где полученные оценки средних щеголяют небольшими и аккуратными «усиками» доверительных интервалов? «Голосование» свидетельствует об одном, а ум и сердце просят совсем другого. Такое бывает. Итак, ориентироваться в первую очередь только на результаты, полученные в большинстве работ, неправильно, так как они могут быть очень неравноценны как по объему выборок, так и по качеству выполнения. Простое голосование оказывается здесь бессильным, но может помочь метаанализ.
Начинается он с того, что ученый аккуратно подбирает работы, которые он хочет включить в свое исследование. Подбирать он их должен в соответствии с ясными, заранее сформулированными критериями, которые должны быть максимально объективны. Цель такого отбора — отсечь наиболее сомнительные с методологической точки зрения работы (в которых использовались маленькие выборки, грубые или устаревшие методы манипуляций с объектами исследований и т. д.). Это очень тонкий момент, делающий метааналитические статьи уязвимыми для критики, поэтому добросовестность исследователя и внятные критерии отбора играют очень важную роль.
Отобрав подходящие работы, ученый извлекает из них необходимые цифровые показатели, например средние значения интересующей нас переменной в опыте и контроле (скажем, число белых кровяных телец в миллилитре крови у кастрированных и «нормальных» животных) и их стандартные ошибки, иногда коэффициенты корреляции и т. п. Полезным оказывается отметить и год публикации каждой работы, чтобы проследить не выхолащивается ли (извините за каламбур!) тема исследования.
Собрав все необходимые данные, метааналитик приступает к следующему этапу — построению статистических моделей. Модели могут отличаться в зависимости от того, что именно интересует исследователя, но в итоге он получит некоторое взвешенное среднее (или медианное) значение интересующего его параметра. Ключевое слово здесь «взвешенное». Оно подчеркивает, что при вычислении интересующего показателя исследованиям присваивался «вес» в соответствии с их «надежностью». Обычно этот вес обратно пропорционален стандартному отклонению, что в теории подразумевает больший вклад масштабных и аккуратных исследований в итоговый результат. В реальности все несколько сложнее, но давайте не будем в это углубляться: о недостатках метаанализа мы еще поговорим.
Метаанализ: дополнительные бонусы
В ходе метаанализа исследователь также может получить важную дополнительную информацию о том, не являются ли полученные данные результатом артефакта, известного под названием publication bias (или file drawer problem). Насколько мне известно, эти термины не имеют устоявшихся русских переводов. Иногда можно встретить перевод «публикационная предвзятость», но у него есть тот недостаток, что его можно интерпретировать как предвзятость ученых, выполняющих научное исследование, в то время как понятие „publication bias“ в большей степени характеризует саму систему публикации научных работ, а не отдельных недобросовестных исследователей. Я бы предложил называть это «проблемой долгого ящика».
Заключается эта проблема в том, что и научным журналам, и самим ученым может оказаться невыгодным печатать даже качественные научные исследования, если в них не получен внятный положительный результат. Скажем, если лекарство не помогло, паразиты не повлияли на поведение своего хозяина или яичники самок соловьев отказались набухать от проигрывания птичкам самых изощренных трелей их ухажеров. Такие результаты ничуть не менее ценны для науки, чем результаты положительные, но… в некотором смысле они скучны, и едва ли на них будут часто ссылаться. О лекарствах, которые не помогают, забывают быстро, хотя в этом случае ситуация сложнее, поскольку возможно прямое лоббирование со стороны фармкомпаний. Очень часто они непосредственно заинтересованы в том, чтобы исследования, показавшие неэффективность той или иной медицинской рекомендации, никогда не оказались напечатанными. Например, сегодня легко вообразить ситуацию, когда исследования, не показавшие большой эффективности медицинских масок в борьбе с вирусными инфекциями, будут положены под сукно, — слишком большие деньги стоят на кону. Впрочем, и без всякой теории заговора работы, в которых нет яркого и запоминающегося результата, могут быть хуже представлены в научной прессе. Это приводит к тому, что абсолютные значения статистических параметров, полученные в ходе метаанализа, имеют тенденцию быть завышенными.
Существуют методы, позволяющие выявить эту проблему и даже отчасти бороться с ней. Самым наглядным из них является так называемый воронковидный график (funnel plot). На нем по горизонтальной оси откладывается величина эффекта (effect size) — для простоты можете думать о ней как о величине различий между опытом и контролем в исследованиях, отобранных для метаанализа. А по вертикальной оси откладывается надежность (в статистическом смысле), с которой эта величина эффекта была определена (рис. 2).
Точность обратно пропорциональна стандартному отклонению или, говоря чуть менее строго, ширине доверительных интервалов, и прямо пропорциональна весу, который придавался каждому исследованию в метаанализе. Даже если вы запутались в моих объяснениях, то не переживайте — дальше будет проще. Если эффекта долгого ящика нет, то получившееся на графике «облако» точек должно напоминать перевернутую воронку, возле горлышка которой сосредоточены наиболее «весомые» и масштабные работы, а внизу всякая «мелюзга». Если эти точки расположены симметрично, то причин не доверять полученным результатам нет, если же с одной стороны (обычно со стороны меньших различий между опытом и контролем — поскольку слабые эффекты мало кого интересуют) точек меньше, то, вероятно, мы имеем дело с эффектом «долгого ящика».
Еще один маленький бонус метаанализа — возможность проверить «выхолащивание» некоторого направления исследований. Бывает так, что первые работы по какой-то теме значительно выбиваются из общего ряда, давая особенно заметный и очевидный результат. Скажем, исследователи заметили, что самцы какого-нибудь вида в период спаривания, когда уровень тестостерона зашкаливает, особенно уязвимы к паразитическим инфекциям, и напечатали работу на эту тему (I. Folstad, A. J. Karter, 1992. Parasites, Bright Males, and the Immunocompetence Handicap). Потом ту же гипотезу проверили на других видах, для которых тоже были серьезные причины предполагать существование такой зависимости. Затем, однако, яблоки, висящие низко, закончились, и исследователям пришлось перейти на виды, у которых зависимость между уровнем половых гормонов и иммунитетом менее очевидна. Возможно, просто потому, что она не такая сильная. Тогда получится, что со временем представленная в статьях величина эффекта будет уменьшаться.
Наконец, метаанализ позволяет оценить однородность результатов различных исследований. Это бывает особенно актуально при исследовании медицинских препаратов. Бывает так, что лекарство «в среднем» помогает, но разные клинические испытания дают очень непохожие результаты. Другими словами, такое лекарство — как пистолет в старой детской считалочке: то стреляет, а то нет. У этого может быть множество причин (разное воздействие на разные группы населения, особенности партии лекарства, подтасовка результатов и т. д.). Важно, что сильная неоднородность результатов может свидетельствовать об отсутствии гарантий того, что результаты метаанализа применимы ко всему спектру условий и обстоятельств, в которых проводили эксперименты и исследования. Обычным способом борьбы с чрезмерной гетерогенностью данных в метаанализе является «выбраковка» исследований, чересчур выделяющихся из общего ряда (J. Higgins et al., 2003. Measuring inconsistency in meta-analyses). Например, в случае с коронавирусом это чаще всего ранние работы, в которых коэффициенты смертности коронавируса оказывались аномально высокими. Однако просто взять и исключить эти результаты из анализа не всегда возможно, поэтому приходится изворачиваться, но об этом ниже.
Итак, в идеальном мире метаанализ оказывается необычайно эффективным инструментом для обобщения результатов разных исследований на одну тему. Более того, он иногда позволяет сделать новые выводы и о предмете исследования, и о качестве анализируемых работ. Но, увы, так происходит только в идеальном мире!
Метаанализ: пятна на Солнце
В реальности есть немало причин относиться к метааналитическим исследованиям с умеренным скепсисом. Одна из возможных (и самых печальных) причин была весьма остроумно сформулирована в учебнике по биостатистике для начинающих Handbook of Biological Statistics: «Проблема метаанализа в том, что многие научные работы — просто дерьмо, а если вы сложите вместе несколько маленьких кучек дерьма, то получите всего лишь одну большую кучу» („The problem with meta-analysis is that a lot of scientific studies really are crap, and pushing a bunch of little piles of crap together just gives you one big pile of crap.“).
Именно поэтому процедура отбора исследований для анализа так важна и именно поэтому ее очень трудно довести до совершенства, даже будучи очень добросовестным человеком. Проблема еще и в том, что бонусы метаанализа, о которых я писал выше, легко могут обернуться и недостатками. Например, асимметрия воронковидного графика лишь намекает на возможный эффект «долгого ящика». Но что если этого эффекта на самом деле нет, а величины эффектов расположены асимметрично просто в силу случайности или, хуже того, в силу какого-то непонятного закона природы, который мы не знаем? Тогда ваша поправка окажется некорректной. Хорошо еще, если вы и впрямь пишете о половых гормонах у тетеревов, а не высказываетесь по животрепещущим общественным вопросам.
Одним из способов избежать таких вопросов является построение статистических моделей, которые оценивают не средневзвешенное среднее, а медиану. Напомню, что медиана — это число, разделяющее выборку на две равные части по количеству элементов. Медиана — очень полезная статистика в тех случаях, когда распределение данных в выборке имеет тяжелые «хвосты» или есть основание предполагать наличие «выбросов». Например, для пятерки чисел 1, 1, 1, 1, 101 среднее арифметическое равно 21, а медиана равна единице. Медиана придает больший вес «обычным», а не экстремальным наблюдениям.
Я потому отдельно останавливаюсь на возможных недостатках метаанализа, что тема, о которой мы будем говорить ниже (опасность коронавируса), сильно политизирована, и мне хочется быть максимально честным с читателем. В заключение всё же хочу заметить, что, несмотря на все подводные камни, метаанализ является общепринятым и эффективным инструментом научных исследований, подчас единственным, позволяющим увидеть лес за торчащими вразнобой деревцами. Относительно метаанализа, о котором пойдет речь ниже, отмечу, что, на мой взгляд, он сделан со всей аккуратностью, возможной в складывающихся обстоятельствах. Итак, к делу.
Возвращаясь к коронавирусу: что изучали?
Основной целью метаанализа, выполненного Джоном Иоаннидисом, была оценка коэффициента смертности от коронавируса. Кроме того, автор исследования стремился определить истинный уровень распространенности COVID-19 в человеческой популяции, учитывая бессимптомные и прочие ускользнувшие от медиков случаи. Наконец, Иоаннидис стремился оценить, не могут ли данные по коронавирусу иметь ряд систематических перекосов, приводящих к завышению или занижению КС.
Аккуратно рассчитать КС не так просто, поскольку практически невозможно точно определить, сколько людей переболело тем или иным заболеванием, ведь многие даже не обращаются к врачу, а иногда — если симптомы были незаметны — даже и не знают о том, что болели. Но сейчас, в биотехнологическую эпоху, проблема определения примерной доли людей, переболевших вирусами бессимптомно, относительно легко решаема — по крайней мере в тех случаях, когда заболевание считается опасным для жителей развитых стран. Это не значит, что определение КС — задача легкая (ниже я немного расскажу о возможных трудностях), но она решаема и… очень важна для всех нас. Дело в том, очень часто на весьма уважаемых новостных ресурсах, популярных сайтах и даже в докладах в американском конгрессе (см. R. B. Brown, 2020. Public Health Lessons Learned From Biases in Coronavirus Mortality Overestimation) приводятся данные о летальности (case fatality ratio, не путать с КС) коронавируса — доле умерших лиц с подтвержденным диагнозом (то есть, грубо говоря, обратившихся в больницу). Это может дать преувеличенное представления об угрозе. КС не надо путать и со смертностью (mortality rate) — долей умерших от всего населения какого-то региона. Этот показатель обманчив, поскольку 10 человек, умерших от болезни в миллионном городе, — казалось бы, совсем немного, но если из этого миллиона болели всего двадцать горожан, то болезнь, которую они подхватили, вероятно, опасна.
Итак, для определения коэффициента смертности важно знать две составляющие: сколько людей умерло от коронавируса в той или иной области (стране или городе, где проводилось исследование) и сколько людей в этой области переболело коронавирусом. Поделив первое число на второе, мы и получим КС. С числителем в этой формуле всё более или менее ясно. Данные о том, сколько людей умерло от коронавируса, публикуются в большом количестве и с завидной регулярностью. Конечно, к качеству этих данных немало вопросов: например, в разгар эпидемии в Италии в умершие от ковида записывали и тех, кто действительно от него умер, и тех, кто умер с ним, но не от него, и даже тех, у кого этот диагноз и вовсе подтвержден не был (S. Bocchia et al., 2020. What Other Countries Can Learn From Italy During the COVID-19 Pandemic). Можно допустить, что кое-где имело место и противоположное: число умерших от коронавируса вольно или невольно занижалось.
А вот подсчет числа переболевших COVID-19, необходимый для вычисления КС, — задача менее простая, и, чтобы рассказать, как ее решают, придется начать следующий раздел.
Как определяют тех, кто уже переболел вирусом?
Одним из способов, позволяющих определить, болел ли человек вирусной инфекцией, служит тест на наличие антител к этому вирусу в сыворотке крови. Напомню, что антитела — это крупные белки плазмы крови, вырабатывающиеся в ответ на инфекцию и служащие для нейтрализации инфекционных агентов (например, вирусных частиц). Существует пять классов антител, и надежный анализ должен проверять испытуемого на наличие трех из них (IgG, IgM и IgA), поскольку разные типы антител появляются на разных этапах развития инфекции. Скажем, IgM появляются и исчезают раньше, чем IgG, и могут свидетельствовать об острой фазе развития инфекции, и т. д. (см., например, D. Jacofsky et al., 2020. Understanding Antibody Testing for COVID-19).
Для своего метаанализа Иоаннидис собирал работы, в которых оценивалось число заболевших от коронавируса от общего числа людей в том или ином регионе, как раз используя тест на наличие антител (так называемые серологические исследования). Ему удалось найти информацию по примерно 30 странам (в основном крупным и/или развитым) и полутора десяткам американских штатов. Список стран можно найти в таблице 1 в обсуждаемой статье. Исследования эпидемической ситуации в России в метаанализ не вошли. Работы, в которых на наличие антител проверили меньше 500 человек, в метаанализ не включались, так как результаты исследований на маленьких выборках могут быть очень неточными. Таким образом, число участников отдельных исследований варьировало от нескольких сотен до нескольких десятков тысяч человек.
Наиболее корректным способом определить распространенность вируса считается тест на случайной выборке. Чтобы его провести, берут базу данных людей, живущих в той или иной области. Из этой базы данных случайным образом отбирают участников тестирования, с которыми связываются по телефону или электронной почте, предлагая принять участие в исследовании. У согласившихся берут кровь и анализируют ее на наличие антител к вирусу. Кажется, что к такому подходу трудно подкопаться и выборка получается действительно случайной, но на самом деле даже такие образцовые, казалось бы, исследования имеют ряд недостатков. Например, чтобы поучаствовать в таком тестировании, нужно иметь телефон или компьютер, не пропустить звонок или письмо, а затем правильно понять переданную информацию. Поэтому в такие исследования могут не попасть слабосильные или слабоумные люди, бездомные, граждане, имеющие проблемы с законом, а также просто малоимущие люди. Зачастую именно перечисленные категории населения особенно уязвимы для инфекционных заболеваний, поскольку не всегда имеют возможность или желание соблюдать элементарные гигиенические нормы или дистанцироваться от больных соседей. Хорошая новость заключается в том, что почти все эти несовершенства выборки приводят к занижению, а не к завышению доли зараженных коронавирусом в популяции, а значит, повышают рассчитанный коэффициент смертности по сравнению с истинным (напомню, что доля зараженных людей в популяции находится в знаменателе коэффициента). Другими словами, худшее, что может случиться в результате неслучайности выборки, это небольшое преувеличение опасности коронавируса по результатам расчетов.
К сожалению, исследований, проведенных на случайной выборке, оказалось не так много, поэтому автор обсуждаемой работы был вынужден включать в свой метаанализ и данные, которые можно охарактеризовать как собранные случайным образом лишь с некоторой натяжкой. Например, данные о доле зараженных коронавирусом среди доноров крови, включенные в исследование, вполне могут быть «перекошены» (biased) в сторону меньшей доли людей, переболевших коронавирусом, из-за так называемого эффекта здорового рабочего или здорового волонтера. История этого феномена уходит корнями в конец XIX века, когда ученым и представителям власти впервые пришло в голову оценить условия труда на различных промышленных предприятиях (R. Chowdhury et al., 2017. Healthy Worker Effect Phenomenon: Revisited with Emphasis on Statistical Methods — A Review). Медики приходили в цех, где, по всем разумным представлениям, условия труда были совершенно разрушительными для организма человека, и обнаруживали там почти исключительно здоровых людей. И это неудивительно, потому что лишь очень здоровые люди могли трудиться в таких условиях. Те, кто уже ослабел от такой работы, уходили с фабрики (зачастую — в мир иной), а те, кто был слаб изначально, просто не могли на эту работу устроиться, поэтому выборка заводских рабочих оказывалась «перекошенной» в сторону людей отменного (до поры) здоровья.
С донорами крови и волонтерами для клинических испытаний — та же проблема. Поскольку кровь идут сдавать преимущественно люди, чувствующие себя хорошо, доля заболевших и переболевших коронавирусом в выборке доноров крови с большой вероятностью окажется ниже, чем доля таковых во всей популяции. Опять же: худшее, что нам грозит в таком случае, — переоценка значения коэффициента смертности, а не недооценка его. Вообще, почти во всех сомнительных случаях Иоаннидис предпочитал корректировать значение КС в сторону повышения, разумно предполагая, что в таком вопросе лучше перестраховаться.
Поправки и корректировки
Стоит отметить, что как при подготовке результатов отдельных исследований по зараженности людей коронавирусом, так и в ходе самого метаанализа ученые часто используют различные поправки, учитывающие особенности и недостатки анализируемой выборки. Их перечисление сделало бы мою статью слишком длинной, но для демонстрации того, что в этих поправках нет ничего страшного, приведу пару примеров.
Скажем, если в ходе исследования проверяют на наличие антител к коронавирусу целые семьи, то результаты тестов внутри семей едва ли можно считать независимыми, поскольку люди, живущие под одной крышей, имеют гораздо больше шансов заразиться друг от друга, чем представители разных домохозяйств. Другими словами, семьи представляют собой что-то вроде кластеров, наблюдения внутри которых нельзя считать независимыми. Существуют методы, позволяющие учесть нарушение независимости наблюдений, но рассказ о них уведет нас слишком далеко. Скажу только, что поправку на кластеризацию наблюдений внутри семей или домов сделать можно.
Еще одна причина сделать поправку — несоответствие половой или возрастной структуры исследуемой выборки таковым во всей популяции. Например, среди доноров крови может быть непропорционально много молодежи или женщин, что нужно принять в расчет. Еще одна проблема: возможные ошибки при тестировании на коронавирус. Для многих методов примерно известны вероятности ложноположительных и ложноотрицательных результатов, которые опять же должны учитываться при обработке данных.
Я говорю об этом так подробно, чтобы показать, что подобные корректировки — ни в коем случае не способ манипулировать данными, а, напротив, рутинные процедуры, позволяющие получить более точную оценку распространенности коронавируса. Беда не в том, что такие корректировки делаются, а в том, что авторы некоторых исследований не удосужились их сделать. Теоретически, отсутствие поправок может «толкнуть» значение КС как вверх, так и вниз, но нет никаких причин считать хоть одно из этих двух направлений предпочтительным. Скорее всего, ошибки из-за отсутствия поправок будут направлены случайным образом и компенсируют друг друга. В любом случае, эти ошибки обычно невелики и едва ли могут оказать значительное влияние на итоговые результаты метаанализа. Так или иначе, но Иоаннидис включал в свой метаанализ исследования, где не были сделаны поправки. В противном случае он не досчитался бы чуть ли не половины данных.
Наконец, в одном случае ему пришлось сделать поправку в сторону увеличения доли людей, зараженных коронавирусом. Как я уже упоминал выше, образцом исследований на распространенности вирусной инфекции в популяции можно считать проверку подопытных на три типа антител, которые начинают синтезироваться раньше или позже в ходе развития инфекции. Однако в некоторых исследованиях участников проверяли лишь на один или два типа антител (на IgG подопытных проверяли всегда, а вот на IgA и IgM — нет), что могло привести к недооценке числа людей, переболевших коронавирусом. Поэтому автор метаанализа корректировал значение распространенности вируса вверх на 10% за каждый недостающий класс антител, то есть максимум на 20%. Эта поправка кажется правомерной, исходя из существующей информации о том, какова вероятность не обнаружить различные классы антител к коронавирусу, если антитела других классов или класса были обнаружены (A. L. Garcia-Basteiro et al., 2020. Seroprevalence of antibodies against SARS-CoV-2 among health care workers in a large Spanish reference hospital). В любом случае, ни эта поправка, ни любая из упомянутых выше не может принципиально (например, в разы) уменьшить значение КС от коронавируса.
Наконец, я бы хотел остановиться еще на двух тесно связанных аспектах исследования Иоаннидиса, на которые он обращает внимание. Первый аспект временной. В силу разных и не до конца ясных причин оценки смертности от COVID-19 имеют четкую тенденцию к снижению со временем. Если в первых работах оценки смертности доходили до нескольких процентов от всех заболевших, то впоследствии они уверенно упали до долей процентов. Нет никаких причин считать, что эта тенденция к снижению уже полностью исчерпала себя, однако в ходе метаанализа поправку на это сделать трудно. Более того, ранние работы с очень высокими показателями смертности и относительно низкими значениями распространенности коронавируса в популяции были включены в обсуждаемое исследование на общих основаниях, поскольку метаанализ подобен песне, из которой слов не выкинешь. Причины, почему первые оценки смертности от коронавируса были столь пессимистичны, могут быть различны, и одна из них наверняка лучше всего описывается русской поговоркой «у страха глаза велики» Не стоит забывать и о коллапсе систем здравоохранения при встрече с незнакомой угрозой. Но, возможно, следует принять во внимание второй аспект — на этот раз пространственный. Исследования коронавируса особенно интенсивно идут в тех местах, где вирус нанес наиболее заметный ущерб. Там проще найти финансирование, а люди охотнее идут на сотрудничество с медицинскими службами. Но, к сожалению, это приводит еще к одному возможному «перекосу» в данных. Оказывается так, что больше всего информации ученые получают из тех мест, где смертность от коронавируса выше среднего уровня. Со временем, когда тестирование на наличие антител к коронавирусу стало более дешевой процедурой, а финансирование полилось рекой, исследованиям на распространенность коронавируса стали подвергать и более благополучные с точки зрения смертности районы, что привело к снижению оценок КС от COVID-19 в большинстве новых исследований. Опять же, как и в случае временного «перекоса», нет никаких причин считать влияние «перекоса» пространственного окончательно исчерпанным, поэтому вероятнее всего, следующие оценки КС от коронавируса будут еще ниже.
Одним из свидетельств упомянутых выше перекосов является высокая неоднородность данных, которую Иоаннидис собрал для своего исследования. КС, рассчитанные по результатам различных работ, оказались распределены несимметрично: большинство оценок группировалось поблизости от ноля, но некоторые оценки убегали далеко вправо по координатной оси, создавая, как говорят статистики, тяжелый «хвост» распределения. Из метаанализа эти «выбросы» исключены не были, но автор исследования предпринял ряд процедур, чтобы несколько уменьшить их возможный вес. В частности, он рассчитывал взвешенные средние значения смертности для каждого региона, в котором проводилось несколько исследований распространенности коронавируса, а не включал каждое исследование отдельно. Это делалось для того, чтобы уменьшить возможное влияние данных, полученных в тех регионах, где смертность от COVID-19 была в силу различных причин непропорционально высока или низка. В качестве таких условных регионов выступали либо страны, либо (в случае с США) штаты. Кроме того, в обсуждаемой работе рассчитывалось не среднее, а медианное значение смертности от вируса, что является обычным подходом при работе с распределениями, обладающими «тяжелыми хвостами», поскольку медиана более устойчива к выбросам, чем среднее.
В целом мне трудно избавиться от ощущения, что в своем метаанализе автор обсуждаемого исследования получил, вероятнее всего, завышенную оценку смертности, но я честно предупредил вас о природе и направлении сделанных корректировок и оставляю за читателям окончательное решение по поводу убедительности полученных Иоаннидисом результатов. Я склонен им доверять.
Что же выяснилось?
Очень важный результат проведенного Иоаннидисом метаанализа заключается в том, что медианное значение коэффициента смертности от коронавируса составило (барабанная дробь) 0,23% (0,27% без учета поправок), что само по себе немного. Напомню, что есть очень серьезные основания считать даже эти оценки сильно завышенными. Например, тот факт, что большая часть исследований проводилась в местах где смертность от коронавируса была больше среднемировой (118 смертей/млн чел. на момент окончания работы над метаанализом — 12 сентября 2020 года), может свидетельствовать о том, что области с аномально высокими КС привлекали внимание исследователей в первую очередь. Это означает, что если бы выборка была действительно случайной, то КС был бы ниже. Еще важнее то, что для людей моложе 70 лет, то есть тех, кто более или менее активно работает, а не вышел на пенсию, коэффициент смертности был еще меньше — 1/20 процента (0,05%), что сопоставимо с «обычным» гриппом (см. 46-й ситуативный отчет ВОЗ от 6 марта). Вообще, вероятность смерти от коронавируса необычайно быстро растет с возрастом (S. Mallapaty, 2020. The coronavirus is most deadly if you are older and male — new data reveal the risks), поэтому угроза здоровью основной части молодого и трудоспособного населения куда ниже приведенных выше оценок.
Этот результат очень важен, поскольку позволяет скорректировать политику государств по сдерживанию эпидемии. В частности, Иоаннидис считает, что разумно перейти от «ковровых бомбардировок» (массовых локдаунов, развертывания госпиталей, закрытия школ и университетов, остановки экономической деятельности и прочего «изумительного разнообразия спасительной градоначальнической строгости») к мерам, не столь масштабным, но, по его мнению, куда более действенным, таким как защита стариков (особенно это актуально в домах престарелых, к числу обитателей которых на Западе весной относилось около половины всех жертв COVID-19, см. K. Danis et al., 2020. High impact of COVID-19 in long-term care facilities, suggestion for monitoring in the EU/EEA, May 2020), препятствование распространению внутрибольничных инфекций, пропаганда мытья рук — одна из немногих, по мнению Иоаннидиса, действительно эффективных мер в борьбе с вирусными инфекциями (P. Saunders-Hastings et al., 2017. Effectiveness of personal protective measures in reducing pandemic influenza transmission: A systematic review and meta-analysis) и т. д.
Помимо КС от COVID-19, исследование Иоаннидиса позволило примерно оценить истинное число переболевших коронавирусом на всем Земном шаре. По грубой прикидке уже на 12 сентября сего года (почти два месяца назад!) таковых могло насчитываться более полумиллиарда, что больше, чем на порядок, превышает число «официально» зарегистрированных больных. Это, повторюсь, очень грубая оценка, сделанная на основе данных о распространенности вируса, которые очень разнятся во времени и пространстве. Скажем, в Швеции в мае доля людей с антителами против COVID-19 составляла 7%, в Канаде в то же время — 0,5%, в одной из коммун Франции в апреле — 10%, в другой — 26%, в Пакистане в июне — 12%, а в России по состоянию на 10 июня по официальным данным она составляла 14%. Разброс, как видите, очень велик. Тем не менее, оценка в полмиллиарда кажется разумной, исходя из результатов других работ. Так, опубликованное в конце сентярбря исследование предполагает, что к 20 июля лишь 1 из 19 случаев COVID-19 попадал в поле зрения медиков, а число заразившихся и переболевших вирусом к тому моменту составляло около 160 миллионов человек (C. Villalobos, 2020. SARS-CoV-2 Infections in the World: An Estimation of the Infected Population and a Measure of How Higher Detection Rates Save Lives).
Эти данные позволяют несколько иначе взглянуть на перспективы достижения коллективного иммунитета. Полагаю, что и полмиллиарда могут оказаться заниженной оценкой. Например, в некоторых местах, где обеспечить эффективное введение карантинных мер необычайно сложно, уже к середине лета был очень высокий процент обывателей с антителами к коронавирусу: по данным исследования, проведенного в первой половине июля, в трущобах Мумбаи их было 58% (A. Matani et al., 2020. Seroprevalence of SARS-CoV-2 in slums and non-slums of Mumbai, India, during June 29 — July 19, 2020), а по состоянию на начало мая в иранской провинции Гилян антитела нашлись у 33% населения (M. Shakiba et al., 2020. Seroprevalence of COVID-19 virus infection in Guilan province, Iran). В большинстве случаев, увы, исследователи обходят вниманием трущобы и страны третьего мира, поэтому влияние данных из этих печальных мест на итоговую оценку распространенности вируса невелико. Возможно, что к настоящему моменту среди жителей неблагополучных районов Мумбаи коллективный иммунитет уже достигнут. Это, конечно, одно из немногих достижений, которыми жители индийских трущоб могут перед нами похвастать, но все же…
В заключение отмечу, что полученные Иоаннидисом результаты вселяют умеренный оптимизм и относительно коэффициента смертности коронавируса, и относительно возможности достижения коллективного иммунитета, и относительно возвращения к нормальному, неполитизированному научному процессу. Впрочем, вместе с этим возникают и новые вопросы насчет того, какие меры по сдерживанию пандемии можно будет считать одновременно и достаточно надежными, и экономически оправданными с учетом этих данных. А также — в каких странах их можно будет пытаться вводить.
Источник
Автор: bambukovi