Коронавирус. Россия. Прогноз на 6 мая

Руслан Богатырев
Коронавирус | Статистика | Россия. Прогноз на 6 мая

41-й день активной части эпидемического процесса (от базовой отметки в 1000 выявленных)

Индикатор повторного возгорания
(+10%): =170 907 (+15537)

Индикатор устойчивости
(+8%): =167 800 (+12430)

Если реальные данные (выявленные случаи) окажутся ниже точки устойчивости, ситуация для России улучшается. Если выше  — начинает ухудшаться. Если она будет выше точки повторного возгорания, начнётся новый виток эпидемического процесса.

—————— МОЙ ПРОГНОЗ НА 06.05.2020

ВЫЯВЛЕННЫЕ:
• 159 565 — 164 226 (по модели Германии);
• 160 653 — 165 314 (по модели США).

УМЕРШИЕ:
• 1542 — 1586 (по модели Германии);
• 1521 — 1564 (по модели США).

—————— ФАКТИЧЕСКИЕ ДАННЫЕ НА 05.05.2020

05.05: +07,0% | +07,0% | +10102, =155370, #1451 (0,93%), (40-й день от базовой отметки в 1000 выявленных)

——

Для прогнозирования применяется адаптивная модель. Она отстраивается от страны-эталона (США и Германия). В соответствии с ней Россия отстаёт от графика Германии на 18 дней и от графика США на 14 дней.

Для построения прогнозов используются две группы по два варианта (соответственно на основе модели Германии и модели США, для тех же дней развития процесса): оптимистичный A и пессимистичный B.

Оптимистичный вариант (A) соответствует показателям относительного ежедневного прироста (выявление, летальность) страны-эталона на сопоставимый день.

Пессимистичный вариант (B) добавляет диапазон (+3% для выявленных и +3% для умерших).


—————— ОСОБЕННОСТИ ПОДХОДА

Официальная статистика (по всем странам) с завязкой на выявленных именно COVID-тестированием – это по большому счету GIGO (garbage in, garbage out) – мусор на входе, мусор на выходе. Прогнозные модели, которые выстраиваются на официальных данных и игнорируют манипуляции с тестированием и реальный физический смысл показателей (и специфику их формирования), изначально в этой странной “пандемии” обречены. Куда разумнее отслеживать, как управляют этими данными конкретные страны, и как в итоге корректируются они с учётом конкурентной борьбы за лучшую статистику.

Многие известные мне попытки выстроить свои модели чаще всего сводятся к хорошо известным моделям SIR/SEIR, которые помогают описать динамику распространения болезни. Но проблема в том, что реальный процесс  и его наблюдение (измерение различными метриками) – разные вещи. А наблюдение в данной ситуации происходит через маленькое запыленное окошечко под названием “Тесты”. Которым можно управлять/манипулировать.

Модель SEIR — весьма известный в эпидемиологии и достаточно распространенный инструмент для прогнозирования эпидемий.

SEIR отражает эволюцию моделируемого процесса и расшифровывается как Susceptible (восприимчивый) — Exposed (подверженный воздействию) — Infectious (инфицированный) — Recovered (вылечившийся). Истоки этого моделирования восходят к теории Кермака-Маккендрика (SIR, 1927).

В 2020 г. модель была доработана профессором Ричардом Нейером (Richard Neher) и его коллегами (Pierre Barrat, Emma Hodcroft, Nicholas Noll, Valentin Druelle) в Базельском университете (University of Basel, Швейцария). Доработана с учётом особенностей эпидемии нового коронавируса SARS-CoV-2. И применялась, в частности, в отношении Чикаго (США).

Ключевая идея модели SEIR — использование эпидемического перехода: модель ведет себя по-разному в зависимости от показателя R0 — среднего числа людей, которых один инфицированный успевает заразить за то время, пока сам не выздоровеет. Если R0 < 1, эпидемия затухает, при показателе больше единицы заражается значительная часть населения.

Но опять-таки надо понимать разницу между (1) развитием процесса и (2) его регистрацией. А она может (и для COVID-19 является) существенным фактором (конкурентной борьбы стран).

Моя адаптивная модель исходит из предположения, что эпидемический процесс для COVID-19 мало отличается от известных процессов для ОРВИ (по длительности на данной популяции/территории). Он может отличаться по нанесенному ущербу (из-за критической нагрузки на систему здравоохранения), что выражается в количестве летальных исходов и показателях летальности. Но в отношении инфицирования населения законы общие (в том числе и потому, что очаговость в мегаполисах схожая). Они общие и для разных стран.  И поскольку многие европейские страны и США опережают нас (примерно на 2-3 недели) в развитии эпидемического процесса, можно сопоставлять и предсказывать ближайшее будущее, наблюдая уже зарегистрированное ближайшее прошлое.

Если калибровать фактические и прогнозные данные (т.е. выровнять в каждой сопоставляемой стране на соответствующий день активного эпидемического процесса), можно смело сравнивать казалось бы несравнимое.

Данные по странам-эталонам известны за 14-18 дней до даты прогноза. И их показатели в модели не меняются. Но в силу ряда причин предпочитаю всё же публиковать свой прогноз накануне.

Калибровка в моей модели ведется с 1000 выявленного случая, что соответствует Базельской модели. Это та отметка, где эпидемический процесс уже набирает начальный ход и где по факту во многих странах и начинали вводиться карантинные меры для всего населения страны.

——

Данные по эпидемической ситуации в России вполне соответствуют мягкому сценарию, при этом (по состоянию на 04.05.2020) вписываются в прогноз по странам-эталонам (Германия и США) с высокой точностью (0,4-0,7%).

Начиная с 23.04.2020 я внес коррективы в параметры модели: мы вышли на другую фазу развития, и интервалы для пессимистичных вариантов сокращены (с +5% до +3% у выявленных, и с +7% до +3% у умерших).

Данные приведены для сопоставимых дней развития эпидемического процесса в каждой стране (т.н. калибровка). За базовую точку при этом выбиралась дата преодоления рубежа в 1000 выявленных случаев (Базельская модель).

Фактические данные по Германии и США — на основе ежедневных отчетов (Situation Reports) Всемирной организации здравоохранения (ВОЗ). Фактические данные по России — на основе ежедневных официальных бюллетеней Роспотребнадзора (они и передаются в ВОЗ).

Далее просто отслеживается отклонение прогноза и факта по России от стран-эталонов (у меня выбраны Германия и США). Точность такого прогноза существенно превышает известные мне теоретические модели, которые создаются под каждую страну в отдельности. Очевидно, что 0,2-2,0% погрешности существенно отличается в лучшую сторону от 5-15% (и уж, тем более, 40%) в подобных моделях.

—————— ИСХОДНЫЕ ДАННЫЕ ДЛЯ ПРОГНОЗА

==> {дата, доля прироста выявленных, доля прироста умерших | прирост выявленных, всего выявленных, умерших, летальность}

——— Модель Германии (для России)

A 06.05.2020: +02,7% | +06,3% | +4195, =159565, #1542 (0,97%)
B 06.05.2020: +05,7% | +09,3% | +8856, =164226, #1586 (0,97%)

Для сопоставления — данные по Германии на соответствующий день (41-й день от базовой отметки в 1000 выявленных)

18.04.2020: +02,7% | +06,3% | +3609, =137439, #4110 (2,99%)

——— Модель США (для России)

A 06.05.2020: +03,4% | +04,8% | +5283, =160653, #1521 (0,95%)
B 06.05.2020: +06,4% | +07,8% | +9944, =165314, #1564 (0,95%)

Для сопоставления — данные по США на соответствующий день (41-й день от базовой отметки в 1000 выявленных)

22.04.2020: +03,4% | +04,8% | +25634, =776907, #37602 (4,84%)

Судя по другим странам, мы вступаем в фазу активного прироста летальных случаев. Но за счет крайне сдержанного развития на начальном этапе наверняка сумеем в абсолютных значениях оставаться на минимуме этого показателя (равно как и в отношении летальности), поскольку длительность  эпидемии у всех примерно одинакова и будет с большой вероятностью укладываться в 12-14 недель.  Кроме того, у нас сопоставимые темпы процентного прироста почти на всем протяжении эпидемического процесса (на чем в общем-то и основана моя адаптивная модель).



—————— ТЕСТЫ

Для прогнозирования эпидемического процесса в России (и сопоставления с другими странами) использую Германию — важный ориентир, поскольку среди европейских стран это лидер и по объему тестирования (вкл. объемы ежедневного тестирования), и по низкой летальности. А также США.

Именно Германия, США и Россия – лидеры по объёмам тестирования (что напрямую влияет на абсолютное количество выявленных).

По данным Worldometer на 05.05.2020

1. США — 7,690,167 (54 дней)  / +227,736
2. Россия — 4,460,357 тестов  (40 дней)  / +160,357
3. Германия — 2,547,052 (58 дней)

Эти данные также стоит калибровать и масштабировать (исходя из базовой отметки и количества прошедших от нее дней).

1. США — 142,411 тестов/день
2. Россия — 111,509 тестов/день
3. Германия — 43,915 тестов/день

Обратите внимание, что данные по Германии (тестирование) обновляются примерно 1 раз в неделю.

Понятно, что количество тестов — один из самых размытых показателей, поскольку это не количество оттестированных. И по практике России видно, что на одного человека у нас приходится нередко около 4 тестов (для постановки диагноза), еще минимум 3 теста (для выписки), неизвестное число тестов для многократно тестируемых персон (даже ежедневно тестируемых), как и количество таких людей.

Но в целом, очевидно, что проведя 100 тестов, никак нельзя получить 150 выявленных. Т.е. граница сверху для оценки известна. По определению.

Потому, если объемы тестирования достаточно малы (как в случае азиатских стран, вкл. Японию, Сингапур, Гонконг и нынешний Китай), объективность выявления крайне невелика.

Для понимания. В Беларуси (население 9,48 млн человек) в сутки делают около 9 тыс. тестов. В С.-Петербурге (5,40 млн человек) — около 7-8 тыс. тестов в сутки. В Москве (12,68 млн человек) 40 тыс. в сутки. В России (146,75 млн человек): 150-225 тыс. тестов в сутки.

В Японии (126,23 млн человек) — около 6-8 тыс. тестов в сутки (!). Данные за 28.04-30.04: 8251, 7028, 6636. В сутки на этом скромном объеме тестирования они выявляют аж 236 человек (данные ВОЗ, на 30.04.2020). За 78 дней (с 16.02.2020, когда они преодолели начальный рубеж в 50 выявленных) в Японии проведено 181,527 тестов.  Т.е. в среднем по 2327 лабораторных исследований (тестов) в сутки.
 
——— ДОП. ИНФОРМАЦИЯ

• Коронавирусная летопись. Ситуационный центр: http://proza.ru/2020/04/28/1189
• Коронавирус. Да здравствует тестократия: http://proza.ru/2020/04/30/2045
• Коронавирус. Эпидемия. Модель лесного пожара: http://proza.ru/2020/04/23/1046
• Коронавирус. Москва и Россия. Бессимптомные и тяжелые. Реальная картина: http://proza.ru/2020/04/24/2228
• Коронавирус. Лукавство статистики. Тесты: http://proza.ru/2020/04/30/1438
• Коронавирус. Москва и Россия: мониторинг, отчётность, оперативность, тестирование: http://proza.ru/2020/05/04/40

• Коронавирус. Россия и Москва. 5 мая. Экспресс-данные: http://proza.ru/2020/05/05/960
• Коронавирус. Россия. 5 мая: http://proza.ru/2020/05/06/90
• Коронавирус. Москва. 5 мая: http://proza.ru/2020/05/06/32

• Коронавирус. Россия. Прогноз на 5 мая: http://proza.ru/2020/05/05/158
• Коронавирус. Россия и Европа. Точки перелома: http://proza.ru/2020/04/21/134
• Коронавирус. 22 апреля. Россия и Германия: http://proza.ru/2020/04/22/1000
• Коронавирус. 14 апреля. Россия и Франция: http://proza.ru/2020/04/14/2520
• Коронавирус. 14 апреля. Россия и Великобритания: http://proza.ru/2020/04/14/2486
• Коронавирус. 14 апреля. Россия и Испания: http://proza.ru/2020/04/14/2427

• Коронавирус. 12 апреля. Россия и Германия: http://proza.ru/2020/04/12/1357
• Коронавирус. 12 апреля. Россия и США: http://proza.ru/2020/04/12/1365
• Коронавирус. 12 апреля. Россия и Китай: http://proza.ru/2020/04/12/1660
• Коронавирус. 12 апреля. Россия и Италия: http://proza.ru/2020/04/12/2031
• Коронавирус. 12 апреля. Россия и Израиль: http://proza.ru/2020/04/13/158