em algorithm 예제

동기는 다음과 같습니다. 매개 변수의 값이 θ {displaystyle {boldsymbol {theta }}를 알고 있는 경우, 일반적으로 잠복 변수 Z{displaystyle mathbf {Z} }의 값을 찾을 수 있습니다 Z {디스플레이 스타일 mathbf {Z} } 단순히 Z {displaystyle mathbf {Z} } 또는 숨겨진 마르코프 모델에 대한 바움 – 웰치 알고리즘과 같은 알고리즘을 통해 반복하여 중 하나. 반대로 잠재 변수 Z {displaystyle mathbf {Z} 의 값을 알고 있는 경우, 매개 변수 θ {displaystyle {boldsymbol {theta }}}의 추정치를 상당히 쉽게 찾을 수 있습니다. 관련 잠재 변수및 각 그룹의 포인트의 값 또는 일부 함수를 평균화합니다. 이것은 반복 알고리즘을 제안, 두 경우 {디스플레이 스타일 {boldsymbol {theta }}}와 Z {디스플레이 스타일 mathbf {Z} 알 수없는 경우: 그냥 경우에, 나는 Do & Batzoglou에 의해 위에서 언급 한 동전 던지기 예제의 루비 구현을 작성하고 그것을 동일한 입력 매개 변수인 $theta_A = 0.6$ 및 $theta_B = 0.5$와 동일한 숫자를 생성합니다. 하드 클러스터 할당을 수행하는 경우 최대 P(xi가 ck에 속하는 경우)를 취하고 해당 클러스터에 데이터 포인트를 할당합니다. 각 데이터 포인트에 대해 이 확률 할당을 반복합니다. 결국 이것은 우리에게 K 클러스터로 첫 번째 데이터 `다시 셔플`을 줄 것이다. 이제 h에서 h`로 초기 추정치를 업데이트할 수 있습니다. 분포 매개 변수를 추정하고 클러스터에 확률 데이터 할당 후 업데이트하는 이 두 단계는 h*로 수렴될 때까지 반복됩니다. 요약하면, EM 알고리즘의 두 단계는 다음과 같습니다 EM 알고리즘 (그리고 그 빠른 변형 주문 하위 집합 기대 최대화) 또한 널리 의료 이미지 재구성에 사용된다, 특히 양전자 방출 단층 촬영 및 단일 광자 방출 컴퓨터 단층 촬영. EM의 다른 더 빠른 변형은 아래를 참조하십시오. 구조 공학에서 기대 최대화(STRIDE) [20] 알고리즘을 사용한 구조 식별은 센서 데이터를 사용하여 구조 시스템의 자연 진동 특성을 식별하는 출력 전용 방법입니다(운영 모달 분석 참조).

진정한 수단을 알고 있다면 어떤 데이터 요소가 가우시안인지 알아낼 수 있습니다. 예를 들어 데이터 포인트의 값이 매우 높은 경우 평균이 높은 분포에서 나온 것일 수 있습니다. 그러나 당신은 수단이 무엇인지 모른다, 그래서이것은 작동하지 않습니다. 그런 다음 EM 알고리즘의 단계를 다음과 같이 볼 수 있습니다. 다중 모달 분포에서 우리는 h = [m1,m2,m2,…,mK; sigma12, sigma22,…,sigmaK2]를 추정할 필요가 있다. EM 알고리즘은 이 작업을 수행하는 데 도움이 될 것입니다. 의 방법을 보자. EM 알고리즘에 사용되는 Q 함수는 로그 가능성을 기반으로 합니다. 따라서 로그 EM 알고리즘으로 간주됩니다.