Коронавирус. Россия. Прогноз на 10 мая

Руслан Богатырев
Коронавирус | Статистика | Россия. Прогноз на 10 мая

45-й день активной части эпидемического процесса (от базовой отметки в 1000 выявленных)

• Индикатор повторного возгорания  (“взлёта”)
(+10%): =218 544 (+19868)

• Индикатор устойчивости
(+8%): =214 570 (+15894)

• Индикатор снижения
(+6%): =210 597 (+11921)


Если реальные данные (выявленные случаи) окажутся ниже точки устойчивости, ситуация для России улучшается. Если выше  — начинает ухудшаться. Если она будет выше точки повторного возгорания, начнётся новый виток эпидемического процесса. Если ниже индикатора снижения — есть положительная тенденция снижения ежедневного прироста.

—————— МОЙ ПРОГНОЗ НА 10.05.2020

ВЫЯВЛЕННЫЕ:
• 201 855 — 207 815 (по модели Германии);
• 207 616 — 213 577 (по модели США).

УМЕРШИЕ:
• 1938 — 1993 (по модели Германии);
• 1917 — 1971 (по модели США).

—————— ФАКТИЧЕСКИЕ ДАННЫЕ НА 09.05.2020

09.05: +05,8% | +06,0% | +10817 (+5667), =198676, -31916, #1827 (0,92%), (44-й день от базовой отметки в 1000 выявленных)

——

Для прогнозирования применяется адаптивная модель. Она отстраивается от страны-эталона (США и Германия). В соответствии с ней Россия отстаёт от графика Германии на 18 дней и от графика США на 14 дней.

Для построения прогнозов используются две группы по два варианта (соответственно на основе модели Германии и модели США, для тех же дней развития процесса): оптимистичный A и пессимистичный B.

Оптимистичный вариант (A) соответствует показателям относительного ежедневного прироста (выявление, летальность) страны-эталона на сопоставимый день.

Пессимистичный вариант (B) добавляет диапазон (+3% для выявленных и +3% для умерших).


—————— ОСОБЕННОСТИ ПОДХОДА

Официальная статистика (по всем странам) с завязкой на выявленных именно COVID-тестированием – это по большому счету GIGO (garbage in, garbage out) – мусор на входе, мусор на выходе. Прогнозные модели, которые выстраиваются на официальных данных и игнорируют манипуляции с тестированием и реальный физический смысл показателей (и специфику их формирования), изначально в этой странной “пандемии” обречены. Куда разумнее отслеживать, как управляют этими данными конкретные страны, и как в итоге корректируются они с учётом конкурентной борьбы за лучшую статистику.

Многие известные мне попытки выстроить свои модели чаще всего сводятся к хорошо известным моделям SIR/SEIR, которые помогают описать динамику распространения болезни. Но проблема в том, что реальный процесс  и его наблюдение (измерение различными метриками) – разные вещи. А наблюдение в данной ситуации происходит через маленькое запыленное окошечко под названием “Тесты”. Которым можно управлять/манипулировать.

Модель SEIR — весьма известный в эпидемиологии и достаточно распространенный инструмент для прогнозирования эпидемий.

SEIR отражает эволюцию моделируемого процесса и расшифровывается как Susceptible (восприимчивый) — Exposed (подверженный воздействию) — Infectious (инфицированный) — Recovered (вылечившийся). Истоки этого моделирования восходят к теории Кермака-Маккендрика (SIR, 1927).

В 2020 г. модель была доработана профессором Ричардом Нейером (Richard Neher) и его коллегами (Pierre Barrat, Emma Hodcroft, Nicholas Noll, Valentin Druelle) в Базельском университете (University of Basel, Швейцария). Доработана с учётом особенностей эпидемии нового коронавируса SARS-CoV-2. И применялась, в частности, в отношении Чикаго (США).

Ключевая идея модели SEIR — использование эпидемического перехода: модель ведет себя по-разному в зависимости от показателя R0 — среднего числа людей, которых один инфицированный успевает заразить за то время, пока сам не выздоровеет. Если R0 < 1, эпидемия затухает, при показателе больше единицы заражается значительная часть населения.

Но опять-таки надо понимать разницу между (1) развитием процесса и (2) его регистрацией. А она может (и для COVID-19 является) существенным фактором (конкурентной борьбы стран).

Моя адаптивная модель исходит из предположения, что эпидемический процесс для COVID-19 мало отличается от известных процессов для ОРВИ (по длительности на данной популяции/территории). Он может отличаться по нанесенному ущербу (из-за критической нагрузки на систему здравоохранения), что выражается в количестве летальных исходов и показателях летальности. Но в отношении инфицирования населения законы общие (в том числе и потому, что очаговость в мегаполисах схожая). Они общие и для разных стран.  И поскольку многие европейские страны и США опережают нас (примерно на 2-3 недели) в развитии эпидемического процесса, можно сопоставлять и предсказывать ближайшее будущее, наблюдая уже зарегистрированное ближайшее прошлое.

Если калибровать фактические и прогнозные данные (т.е. выровнять в каждой сопоставляемой стране на соответствующий день активного эпидемического процесса), можно смело сравнивать казалось бы несравнимое.

Данные по странам-эталонам известны за 14-18 дней до даты прогноза. И их показатели в модели не меняются. Но в силу ряда причин предпочитаю всё же публиковать свой прогноз накануне.

Калибровка в моей модели ведется с 1000 выявленного случая, что соответствует Базельской модели. Это та отметка, где эпидемический процесс уже набирает начальный ход и где по факту во многих странах и начинали вводиться карантинные меры для всего населения страны.

——

Данные по эпидемической ситуации в России вполне соответствуют мягкому сценарию, при этом (по состоянию на 07.05.2020) вписываются в прогноз по странам-эталонам (Германия и США) с высокой точностью (0,8-1,0%).

Начиная с 23.04.2020 я внес коррективы в параметры модели: мы вышли на другую фазу развития, и интервалы для пессимистичных вариантов сокращены (с +5% до +3% у выявленных, и с +7% до +3% у умерших).

Данные приведены для сопоставимых дней развития эпидемического процесса в каждой стране (т.н. калибровка). За базовую точку при этом выбиралась дата преодоления рубежа в 1000 выявленных случаев (Базельская модель).

Фактические данные по Германии и США — на основе ежедневных отчетов (Situation Reports) Всемирной организации здравоохранения (ВОЗ). Фактические данные по России — на основе ежедневных официальных бюллетеней Роспотребнадзора (они и передаются в ВОЗ).

Далее просто отслеживается отклонение прогноза и факта по России от стран-эталонов (у меня выбраны Германия и США). Точность такого прогноза существенно превышает известные мне теоретические модели, которые создаются под каждую страну в отдельности. Очевидно, что 0,2-2,0% погрешности существенно отличается в лучшую сторону от 5-15% (и уж, тем более, 40%) в подобных моделях.

 
—————— ИСХОДНЫЕ ДАННЫЕ ДЛЯ ПРОГНОЗА

==> {дата, доля прироста выявленных, доля прироста умерших | прирост выявленных, всего выявленных, умерших, летальность}

——— Модель Германии (для России)

A 10.05.2020: +01,6% | +06,1% | +3179, =201855, #1938 (0,96%)
B 10.05.2020: +04,6% | +09,1% | +9139, =207815, #1993 (0,96%)

Для сопоставления — данные по Германии на соответствующий день (45-й день от базовой отметки в 1000 выявленных)

22.04.2020: +01,6% | +06,1% | +2237, =145694, #4879 (3,35%)

——— Модель США (для России)

A 10.05.2020: +04,5% | +04,9% | +8940, =207616, #1917 (0,92%)
B 10.05.2020: +07,5% | +07,9% | +14901, =213577, #1971 (0,92%)

Для сопоставления — данные по США на соответствующий день (45-й день от базовой отметки в 1000 выявленных)

26.04.2020: +04,5% | +04,9% | +38509, =899281, #46204 (5,14%)

Судя по другим странам, мы вступаем в фазу активного прироста летальных случаев. Но за счет крайне сдержанного развития на начальном этапе наверняка сумеем в абсолютных значениях оставаться на минимуме этого показателя (равно как и в отношении летальности), поскольку длительность  эпидемии у всех примерно одинакова и будет с большой вероятностью укладываться в 12-14 недель.  Кроме того, у нас сопоставимые темпы процентного прироста почти на всем протяжении эпидемического процесса (на чем в общем-то и основана моя адаптивная модель).

—————— ПОГРЕШНОСТИ ТЕСТИРОВАНИЯ. ЛУКАВСТВО СТАТИСТИКИ

Тестирование в рамках лабораторной диагностики существенно влияет на внешние показатели, прежде всего, на основной параметр – число выявленных случаев инфицирования.

Россия взяла курс на наращивание объемов тестирования. Очевидно, что это связано с потребностью в расширении сети лабораторий (Роспотребнадзора, при государственных медицинских учреждениях и частных лабораторий).

Роспотребнадзор раз в неделю (с 16.04.2020) публикует данные о количестве лабораторий. Вот как наращивали их количество: 376, 438, 536, 594. Итак, на 08.05.2020 у нас задействованы 594 лаборатории (107 Роспотребнадзора, 412 при гос.учреждениях и 75 частных).

Наращивались и объемы тестирования. По ежедневным данным Роспотребнадзора можно вычислить изменение суточной базы тестирования и показатель выявляемости.

Показатель выявляемости есть отношение числа выявленных случаев к количеству проведенных тестов. В рамках одних суток более одного человека не тестируют, поэтому это и количество тестируемых.

Показатель выявляемости свидетельствует о “концентрации” инфицирования в выборке тестирования. И если формирование выборки производится не первый день, если не вносятся какие-то кардинальные изменения в саму методику тестирования и в выбор тестируемых, это неплохой показатель концентрации инфицирования. Его увеличение говорит о нарастании эпидемии, а не о спаде. И наоборот.

Вот как менялась суточная база тестирования по России (на основе данных Роспотребнадзора),

{количество тестов, их прирост, прирост выявленных, показатель выявляемости}

09.05.2020: 5,221,964 (+234,496), +10817 (4,61%)
08.05.2020: 4,987,468 (+184,276), +10699 (5,81%)
07.05.2020: 4,803,192 (+169,461), +11231 (6,63%)
06.05.2020: 4,633,731 (+173,374), +10559 (6,09%)
05.05.2020: 4,460,357 (+157,114), +10102 (6,43%)
04.05.2020: 4,303,243 (+178,863), +10581 (5,92%) 
03.05.2020: 4,124,380 (+178,862), +10633 (5,94%) 
02.05.2020: 3,945,518 (+221,711), +9623 (4,34%) 
01.05.2020: 3,723,807 (+225,499), +7933 (3,52%) 
30.04.2020: 3,498,308 (+194,591), +7099 (3,65%) 
29.04.2020: 3,303,717 (+164,459), +5841 (3,55%) 

Нетрудно заметить, что локальный минимум на этом интервале дат был 05.05.2020 и составил 157 114 тестов. Локальный максимум был достигнут 09.05.2020 и составил 234 496 тестов в сутки.

Очевидно, что если бы суточная база тестирования оставалась неизменной, это были бы более объективные условия для сопоставления с данными в другие даты.

Для того чтобы выяснить, какую погрешность дает гонка тестирования, воспользуемся показателем выявляемости. Возьмем минимальное его значение 3,5 (для оценки снизу). Вычислим для 09.05.2020 лишнее количество выявленных за счет наращивания суточной базы тестирования.

Итак, по отношению к локальному минимуму (05.05.2020) она выросла на 77382 теста. Умножим на 0,035 (3,5% выявляемости). Получим 2708. В этот день было выявлено официально 10817 случаев инфицирования. Но на гораздо большей базе тестирования. Следовательно, для фиксированной базы (на 05.05.2020) получилось “лишних” 2708 случаев. Иными словами, должно было быть 8109 (10817-2708).

Для понимания погрешности. Доля Москвы составляет примерно 50% по выявленным случаям во всей статистике по России (если быть точным, 52,4% на 09.05.2020). За последние дни (с 05.05.2020) суточный прирост выявленных по Москве колебался в диапазоне 5667-6703. Т.е. погрешность в 2708 — это примерно 50% от Москвы и соответственно 25% от России.

Т.е. влияние на официальную статистику крайне велико.  Равно как и на выводы и орг.выводы.

Отсюда следует, что построение любых моделей, не учитывающих колебания суточной базы тестирования, во многом обречено. В других странах колебания тоже имеют место, и они весьма существенные. Другой вопрос, что это отслеживать непросто. Прежде всего, в силу закрытости  данных о суточном тестировании (данные нередко обновляются раз в неделю, что искажает реальную картину).

Ниже приведены данные о погрешности тестирования в России (за счет изменения суточной базы). Указана суточная база (количество тестов в сутки), прирост новых выявленных случаев и в скобках – “лишний” прирост (погрешность тестирования).

09.05.2020: 234,496 / +10817 (2708)
08.05.2020: 184,276 / +10699 (951)
07.05.2020: 169,461 / +11231 (432)
06.05.2020: 173,374 / +10559 (569)
05.05.2020: 157,114 / +10102 (0)
04.05.2020: 178,863 / +10581 (761) 
03.05.2020: 178,862 / +10633 (761) 
02.05.2020: 221,711 / +9623 (2261) 
01.05.2020: 225,499 / +7933 (2393) 
30.04.2020: 194,591 / +7099 (1312) 
29.04.2020: 164,459 / +5841 (257) 

По Москве аналогичный контроль провести нельзя: данные о количестве тестов обновляются Роспотребнадзором раз в неделю. Можно лишь на интервалах в неделю отследить некоторые колебания, но это куда менее ценная информация, чем суточная погрешность тестирования для России.

——— ТЕСТЫ КАК  КЛЮЧ К ПРИНЯТИЮ РЕШЕНИЙ

08.05.2020 Роспотребнадзор опубликовал и ввел в действие Методические рекомендации МР № 3.1.0178-20  “Определение комплекса мероприятий, а также показателей, являющихся основанием для поэтапного снятия ограничительных мероприятий в условиях эпидемического распространения COVID-19”.

Выдержка из сообщения Роспотребнадзора (08.05.2020):

<< Методика оценки готовности к выходу из ограничительных мероприятий включает в себя оценку таких параметров как коэффициент распространения инфекции, вычисляемый как среднее количество людей, которых инфицирует один больной до его изоляции, свободный коечный фонд и охват тестированием. Таким образом, для каждого региона период выхода из ограничительных мероприятий и его продолжительность будут индивидуальными. На каждом этапе ограничения отменяются постепенно. Сначала станут возможны прогулки и занятия спортом на улице, работа небольших объектов непродовольственной торговли и услуг, исключающих одномоментный контакт большого числа людей. Прежде всего, возобновляется работа предприятий, деятельность которых непосредственно связана с потребителями.

На втором этапе смогут осуществлять свою деятельность предприятия торговли большей площади, отдельные образовательные организации. При этом сохранятся ограничения на предельное количество лиц, которые могут одновременно находиться в торговом зале

На третьем этапе возобновится работа предприятий торговли и сферы услуг – без ограничения числа одновременно обслуживаемых посетителей и площади открываемого объекта, предприятий общественного питания, гостиниц, образовательных учреждений без исключения. >>

Выдержка из Методических рекомендаций:

<< 3. Предполагается поэтапное (три этапа) возобновление деятельности предприятий и организаций, деятельность которых непосредственно связана с потребителями, в Российской Федерации. Для каждого из этапов устанавливается свое значение показателей, являющихся основанием для поэтапного снятия ограничительных мероприятий в условиях эпидемического рапространения COVID-19.

4. Основные показатели устанавливаются Главным государственным санитарным врачом Российской Федерации, значения дополнительных показателей предлагаются главными санитарными врачами субъектов Российской Федерации.

Основными показателями являются:
- Rt – коэффициент распространения инфекции, вычисляемый как среднее количество людей, которых инфицирует один больной до его изоляции;
- наличие свободного коечного фонда для лечения больных COVID-19;
- показатель тестирования на 100 тысяч населения.

В качестве дополнительных показателей могут рассматриваться:
- уровень летальности от COVID-19;
- регистрируемая недельная заболеваемость внебольничными пневмониями (суммарно) в сравнении с многолетним уровнем, рассчитанным за последние 3 года;
- доля лиц, имеющих иммунитет к COVID-19 среди населения по результатам выборочных исследований.

Определение значения дополнительных показателей может использоваться субъектами Российской Федерации для целей подтверждения целесообразности перехода на соответствующий этап.  >>

Далее идет изложение сути каждого этапа (что разрешено) и условия перехода к каждому этапу (какие должны быть значения основных показателей).

Если кратко,

=== Первый этап (занятия спортом на открытом воздухе, прогулки не более 2 человек вместе; возобновление работы сферы услуг и торговли непродовольственными товарами – площади до 400 кв.м.)
 
1.1. Rt < 1,0
1.2. Коечный фонд – не менее 50% от нормативной потребности в инфекционных койках
1.3. Охват тестирования населения методом ПЦР – не менее 70 на 100 тысяч населения в день (рассчитывается как среднее значение за предыдущие 7 дней).

=== Второй этап (возобновление работы отдельных образовательных организаций; торговые залы до 800 кв.м.)
 
2.1. Rt < 0,8
2.2. Коечный фонд – не менее 50% от нормативной потребности в инфекционных койках
2.3. Охват тестирования населения методом ПЦР – не менее 90 на 100 тысяч населения в день.

=== Третий этап (возобновление работы всех образовательных организаций, предприятий общественного питания, гостиниц, мест отдыха – парки, скверы; торговые залы без ограничения площади)
 
3.1. Rt < 0,5
3.2. Коечный фонд – не менее 50% от нормативной потребности в инфекционных койках
3.3. Охват тестирования населения методом ПЦР – не менее 110 на 100 тысяч населения в день.


Итак, мы не можем отслеживать коечный фонд – эти данные закрыты.  А вот охват тестирования для Москвы посчитать нетрудно.

Население Москвы: 12,69 млн человек (на 2020).
Для охвата в 110 на 100 тысяч населения требуется проводить в сутки 126,9*110=13959 тестов.

Приведу среднее число тестов в сутки (Москва) для последних трёх недель:
• 26424 – для дат с 16.04.2020 по 22.04.2020
• 38919 – для дат с 23.04.2020 по 29.04.2020
• 41410 – для дат с 30.04.2020 по 08.05.2020

Эти данные получены на основе еженедельных отчетов Роспотребнадзора по субъектам РФ.


 
Стоит ли говорить, что норму Москва не только выполнила, но и перевыполнила почти в 3 раза.

Коечный фонд Москвы с большой вероятностью тоже не основа для сохранения карантинных ограничений.

Остается единственный параметр, за которым и надо следить. Это Rt – “коэффициент распространения инфекции”.

Он в трактовке Роспотребнадзора как бы соответствует реальному показателю R0, используемому в эпидемилологии  и в построении математических моделей (он означает среднее количество людей, которых инфицирует один больной до его изоляции; для COVID-19 это в районе 1,0-3,5 на этапе развития эпидемии).

Но если посмотреть ту формулу, по которой его вычисляет Роспотребнадзор, становится понятно, что отношение к R0 имеет отдаленное. Похоже на очередное лукавство.

Rt вычисляется просто. Берутся данные суточного прироста выявленных за последние 8 дней. Этот набор разбивается на две части – верхнюю (последние 4 дня)  и нижнюю (предшествующие им 4 дня). Сумма верхней части делится на сумму нижней.

По сути просто усредняется прирост за 4 суток. И смотрится отношение двух таких наборов. Ясно, что снижение меньше 1,0 возможно, когда начнет падать и суточный прирост. Только вот к реальному R0 это имеет отдаленное отношение.

Покажу, как менялся этот (только что введенный Роспотребнадзором) ключевой показатель по России и Москве за последние 2 недели.

(дата, прирост по России, прирост по Москве, Rt для России, Rt Для Москвы)

09.05: +10817 (+5667) | 1,06 (1,06)
08.05: +10699 (+5846) | 1,10 (1,17)
07.05: +11231 (+6703) | 1,20 (1,34)
06.05: +10559 (+5858) | 1,37 (1,64)
05.05: +10102 (+5714) | 1,50 (1,91)
04.05: +10581 (+5795) | 1,52 (1,84)
03.05: +10633 (+5948) | 1,42 (1,61)
02.05: +9623 (+5358) | 1,22 (1,23)
01.05: +7933 (+3561) | 1,12 (1,05)
30.04: +7099 (+3093) | 1,11 (1,07)
29.04: +5841 (+2220) | 1,14 (1,11)
28.04: +6411 (+3075) | 1,16 (1,09)
27.04: +6198 (+2871) | 1,22 (1,19)
26.04: +6361 (+2971) | 1,08 (0,94)


Достаточно сомнительно выглядит утверждение (это напрямую следует из приведенных данных), что 26.04.2020 в Москве в среднем один инфицированный заражал 0,94 человека (т.е. эпидемия идет на спад), а затем через 9 дней она вдруг делает резкий скачок до 1,91 (это характерно для гриппа на пике) и буквально через 4 дня вновь около отметки 1,0.

При этом истинную цену прироста выявленных случаев (на что все смотрят в первую очередь) я подробно выше показал. Ясно, что Rt вкупе с тестами (изменение суточной базы тестирования) весьма напоминает скрытый механизм манипуляции. И не только для России, что важно.


——— ДОП. ИНФОРМАЦИЯ

• Коронавирусная летопись. Ситуационный центр: http://proza.ru/2020/04/28/1189
• Коронавирус. Да здравствует тестократия: http://proza.ru/2020/04/30/2045
• Коронавирус. Эпидемия. Модель лесного пожара: http://proza.ru/2020/04/23/1046
• Коронавирус. Москва и Россия. Бессимптомные и тяжелые. Реальная картина: http://proza.ru/2020/04/24/2228
• Коронавирус. Лукавство статистики. Тесты: http://proza.ru/2020/04/30/1438
• Коронавирус. Москва и Россия: мониторинг, отчётность, оперативность, тестирование: http://proza.ru/2020/05/04/40

• Коронавирус. Россия. Прогноз на 9 мая: http://proza.ru/2020/05/09/298
• Коронавирус. Россия. Прогноз на 8 мая: http://proza.ru/2020/05/08/194
• Коронавирус. Россия. Прогноз на 7 мая: http://proza.ru/2020/05/07/164
• Коронавирус. Россия. 7 мая: http://proza.ru/2020/05/08/166
• Коронавирус. Москва. 7 мая: http://proza.ru/2020/05/08/97

• Коронавирус. Россия и Европа. Точки перелома: http://proza.ru/2020/04/21/134
• Коронавирус. 22 апреля. Россия и Германия: http://proza.ru/2020/04/22/1000
• Коронавирус. 14 апреля. Россия и Франция: http://proza.ru/2020/04/14/2520
• Коронавирус. 14 апреля. Россия и Великобритания: http://proza.ru/2020/04/14/2486
• Коронавирус. 14 апреля. Россия и Испания: http://proza.ru/2020/04/14/2427

• Коронавирус. 12 апреля. Россия и Германия: http://proza.ru/2020/04/12/1357
• Коронавирус. 12 апреля. Россия и США: http://proza.ru/2020/04/12/1365
• Коронавирус. 12 апреля. Россия и Китай: http://proza.ru/2020/04/12/1660
• Коронавирус. 12 апреля. Россия и Италия: http://proza.ru/2020/04/12/2031
• Коронавирус. 12 апреля. Россия и Израиль: http://proza.ru/2020/04/13/158