Measurement Invarince Review

728x90

## 잠재범주분석(Latent class analysis)

-   Latent class analysis는 하나의 시점에서 관측된 범주형 변수들에 대한
    개체들의 응답 결과에 기반하여 유사한 응답 패턴을 가지는 몇 개의
    하위집단으로 모집단을 나누는 방법 <br>
-   이때 하위집단은 직접적으로 측정될 수 없기 때문에 잠재범주(Latent
    class)라고 부른다. <br>
-   Latent class analysis는 잠재변수가 주어졌을 때 관측변수들은 서로
    독립이라는 지역 독립성(Local independence) 가정에서 출발하는데, 이는
    관측변수들 사이의 관계를 잠재변수가 모두 설명한다는 것을 의미한다.
    <br>
-   개체들을 $C$개의 범주로 분류하는 잠재변수 $L$이 있다고 하자. 또한
    $L$을 규명하기 위한 $M$개의 관측변수
    $\bf{Y}$$= (Y_{1},...,Y_{M})^{T}$가 있고, $Y_{m}$은 1부터 $r_{m}$
    사이의 값을 갖는다고 하자. 각 개체의 Latent class가 알려져 있다고
    했을 때, $i$번째 개체가 잠재범주 $l$에 속하면서
    $\bf{y}$$=(y_{i1},...,y_{iM})^{T}$라 응답할 확률은 식(2.1)과
    같다.$(l=1,...,C;m=1,...,M;k=1,...,r_{m})$.

<br> <br> $$
P(L_{i}=l,\bf{Y_{i}=y_{i}})=P(L_{i}=l)\prod_{m=1}^{M}P(\bf{Y_{i}=y_{i}}|L_{i}=l)\\=\gamma_{l}\prod_{m=1}^{M}\prod_{k=1}^{r_{m}}\rho_{mk|l}^{I(y_{im}=k)}
$$

-   $\gamma_{l}$은 잠재범주 $l$에 속할 때 $m$번째 문항에 $k$라고 답할
    확률을 나타낸다. $I(y_{im}=k$는 지시함수로서 $y_{im}=k$인 경우 1의
    값을, 그렇지 않은 경우 0의 값을 갖는다. 실제로 잠재범주는 관측되지
    않으므로 i번째 개체에 대한 우도함수는 다음과 같이 구할 수 있다.

$$
P(\bf{Y_{i}}=y_{i})=\sum_{l=1}^{C}\gamma_{l}\prod_{m=1}^{M}\prod_{k=1}^{r_{m}}\rho_{mk|l}^{I(y_{im}=k)}
$$

## 잠재범주프로파일분석(Latent class profile analysis)

-   범주형 변수가 두 개 이상의 시점에서 관측되었다고 했을 때, 시점별로
    잠재범주분석을 실시할 수 있을 것이다. 그러면 개체들의 범주 결과에
    기반하여 비슷한 범주 변화 패턴을 가지는 개체끼리 묶을 수 있는데,
    이러한 분석을 잠재범주프로파일분석(latent class profile
    analysis)이라고 한다.

-   우선 각 시점에서의 응답 결과에 기반하여 개체들을 몇 개의 잠재범주로
    분류한다. 그 후 개체들의 범주 변화 양상에 따라 모집단을 몇 개의
    하위집단으로 나누는데, 이때 하위집단을 프로파일(profile)이라고 한다.
    잠재범주와 마찬가지로 프로파일도 직접적으로 측정할 수 없기 때문에
    잠재변수이다.

-   잠재범주프로파일의 가정 -- (1) 잠재프로파일은 오로지 잠재범주를
    통해서만 관측변수에 영향을 준다. -- (2) 어떤 시점에서 잠재범주가
    주어졌을 때 관측변수들은 서로 독립이다. -- (3) 잠재프로파일이
    주어졌을 때 잠재범주들은 서로 독립이다.

-   가정(2),(3)은 분석의 근간이 되는 지역독립성 가정을 나타내는 것으로,
    각각 잠재범주는 관측변수들 사이의 관계를 모두 설명하고
    잠재프로파일은 잠재범주들 사이의 관계를 모두 설명한다는 것을
    의미한다.

-   개체들을 S개의 프로파일로 분류하는 잠재프로파일 $U$가 있다고 하자.
    시점이 $T(\geq2)$개일 때, 각 시점에서 개체들을 $C$개의 범주로
    분류하는 잠재범주 $C=(C_{1},...,C_{T})$가 있다고 하자. $C$를
    규명하기 위한 관측변수를 $\bf{Y=(Y_{1},...,Y_{T})}$라 할
    때${\bf{Y_{t}}}=(Y_{1t},...,Y_{Mt})^{T}$이며 $Y_{mt}$는 1부터
    $r_{m}$ 사이의 값을 갖는다고 하자$(m=1,...M;t=1,...,T)$. 각 개체의
    잠재프로파일과 잠재범주가 알려져 있다고 했을 때, $i$번째 개체가
    잠재프로파일 $s$, 잠재범주 ${\bf{C_{i}}} = (c_{i1},...,c_{iT}$에
    속하면서 $y_{i}=(y_{i1},...,y_{iT})$라 응답할 확률은 식(2.3)과 같다.

## Simulation for latent class

```{r}
library(poLCA)
nclass = 3
nitem = 12
nresp = c(2,2,2,2,2,2,2,2,2,2,2,2)

```

728x90

'Statistic Class > Latent Class' 카테고리의 다른 글

LCA and LTA 목차 정리  (0) 2024.04.02
#1.1 Theasis review LCA  (0) 2024.01.05
Latent Growth Model(잠재성장모형)  (0) 2023.10.13
#2. Latent Class, Latent Transition 논문리뷰  (0) 2023.10.04