Intro
확률(probability)은 불확실성에 대한 연구입니다. 확률은 사건이 발생한 횟수의 비율이나 사건에 대한 믿음의 정도라고 생각할 수 있습니다. 우리는 이러한 확률을 사용하여 실험을 통해 어떤 일이 발생할 확률을 측정하고자 합니다. 1장에서 데이터의 불확실성, 머신러닝 모델의 불확실성, 모델을 통해 생성된 예측의 불확실성을 정량화한다고 언급했습니다. 이러한 불확실성(unceratinty)을 정량화하려면 random variables(확률 변수)라는 것이 필요한데, 확률 변수는 우리가 관심있는 속성의 집합에 무작위 실험의 결과를 매핑하는 함수입니다. 확률 변수와 관련된 것은 특정 결과(or set of outcomes)가 발생할 확률을 측정하는 함수이며, 이를 probability distribution(확률 분포)이라고 합니다.
확률 분포는 probabilistic modeling(8.4장), graphical models(8.5장), model selection(8.6장)과 같은 다른 개념들을 위한 building block으로 사용됩니다. 6.1장에서는 probability space를 정의하는 세 가지 개념(sample space, events, probability of an event)과 어떻게 이 세 가지 개념들이 네 번째 개념인 random variable과 연관되는지 살펴봅니다.
6장을 통해 살펴볼 개념들의 개요는 다음과 같습니다.