К ТФО. Модель скрытого класса
Сопроводительные материалы
Модель скрытого (латентного) класса
В статистике модель скрытого класса (LCM) представляет собой модель кластеризации многомерных дискретных данных.
Предполагается, что данные возникают из смеси дискретных распределений, в пределах каждого из которых переменные независимы. Это называется моделью скрытого класса, потому что класс, к которому принадлежит каждая точка данных, является ненаблюдаемым, или латентным.
Анализ скрытого класса (LCA) - это подмножество моделирования структурными уравнениями, используемое для поиска групп или подтипов случаев в многомерных категориальных данных. Эти подтипы называются "скрытыми классами".
Столкнувшись со следующей ситуацией, исследователь может выбрать использование LCA для понимания данных: представьте, что симптомы a-d были измерены у ряда пациентов с заболеваниями X, Y и Z, и что заболевание X связано с наличием симптомов a, b и c, заболевание Y - с симптомами b, c, d, а заболевание Z - с симптомами a, c и d.
LCA попытается обнаружить присутствие латентных классов (объектов заболевания), создавая ассоциативные паттерны в симптомах. Как и в факторном анализе, LCA также может использоваться для классификации случаев в соответствии с их максимальной вероятностью принадлежности к классу.
Поскольку критерием решения LCA является достижение скрытых классов, внутри которых больше нет никакой связи одного симптома с другим (поскольку класс - это заболевание, вызывающее их ассоциацию), а набор заболеваний, имеющихся у пациента (или класс, к которому принадлежит случай), вызывает ассоциацию симптомов, симптомы будут "условно независимыми", т.е. в зависимости от принадлежности к классу они больше не связаны.
Модель
Внутри каждого скрытого класса наблюдаемые переменные статистически независимы. Это важный аспект. Обычно наблюдаемые переменные статистически зависимы. При введении скрытой переменной восстанавливается независимость в том смысле, что внутри классов переменные независимы (локальная независимость). Затем мы говорим, что связь между наблюдаемыми переменными объясняется классами скрытой переменной (McCutcheon, 1987).
Вероятностная модель, используемая в LCA, тесно связана с наивным байесовским классификатором. Основное отличие заключается в том, что в LCA принадлежность индивида к классу является скрытой переменной, тогда как в наивных байесовских классификаторах принадлежность к классу является наблюдаемой меткой.
Связанные методы
Существует ряд методов с разными названиями и видами использования, которые имеют общую взаимосвязь. Кластерный анализ, как и LCA, используется для обнаружения таксоноподобных групп случаев в данных.
Оценка многомерной смеси (MME) применима к непрерывным данным и предполагает, что такие данные являются результатом сочетания распределений: представьте набор высот, полученный в результате смешения мужчин и женщин.
Если оценка многомерной смеси ограничена, так что показатели должны быть некоррелированными внутри каждого распределения, это называется анализом скрытого профиля.
Модифицированный для обработки дискретных данных, этот ограниченный анализ известен как LCA.
Модели дискретных скрытых признаков дополнительно ограничивают формирование классов из сегментов одного измерения: по сути, распределяя членов по классам в этом измерении: примером может быть распределение случаев по социальным классам в зависимости от способностей или заслуг.
В качестве практического примера переменными могут быть пункты политической анкеты с множественным выбором. Данные в данном случае состоят из N-образной таблицы непредвиденных обстоятельств с ответами на вопросы для ряда респондентов.
В этом примере:
- скрытая переменная относится к политическим взглядам, а
- скрытые классы - к политическим группам.
Учитывая членство в группе, условные вероятности определяют вероятность выбора определенных ответов.
Применение
LCA может использоваться во многих областях, таких как:
- коллаборативная фильтрация,
- генетика поведения и
- оценка диагностических тестов.
По материалам Википедия.
Свидетельство о публикации №224042101235