본문 바로가기

통계4

통계 분포 확률분포 (Probability Distribution)정의확률분포는 어떤 확률변수가 취할 수 있는 모든 가능한 값과 그 값들이 발생할 확률을 나타내는 함수입니다. 이는 확률변수가 취할 수 있는 값들의 집합과 각각의 값에 할당된 확률로 구성됩니다.유형확률분포는 크게 이산확률분포와 연속확률분포로 나눌 수 있습니다.이산확률분포: 이산적인 값을 가지는 확률변수를 위한 분포 (예: 이항분포, 푸아송분포).연속확률분포: 연속적인 값을 가지는 확률변수를 위한 분포 (예: 정규분포, t-분포, 카이제곱분포) 1. 정규분포 (Normal Distribution)정의정규분포는 연속확률분포, 데이터가 평균을 중심으로 대칭적으로 분포하는 형태를 가지며, 가장 널리 알려진 연속확률분포입니다. 이는 종 모양의 곡선으로 표현되며.. 2024. 8. 7.
상관관계와 인과관계 | Correlation does not imply causation 상관관계란(Correlation) ? 두 변수 간의 관계를 나타내며, 한 변수의 변화가 다른 변수의 변화에 어떻게 영향을 미치는지를 설명합니다. 양의 상관관계, 음의 상관관계, 또는 상관관계가 없는 경우로 구분된다. 산점도(Scatter plot) 예시 (상관계수를 함께 표현) 양의 상관관계: 한 변수가 증가할 때 다른 변수도 증가하는 관계. 예를 들어, 키와 체중.음의 상관관계: 한 변수가 증가할 때 다른 변수가 감소하는 관계. 예를 들어, 운동량과 체지방율.상관관계 없음: 두 변수 간에 규칙적인 패턴이 없는 경우. 상관계수의 의미와 한계:상관계수는 두 변수 간의 선형 관계만을 측정합니다. 비선형 관계를 감지하는 데는 한계가 있습니다.상관계수는 데이터의 척도와 단위에 영향을 받지 않으므로, 서로 다른 .. 2024. 8. 1.
기술통계와 추론통계 기술 통계와 추론 통계: 데이터의 이해와 해석 데이터 분석은 크게 기술 통계와 추론 통계로 나눌 수 있습니다. 이 두 가지 접근법은 데이터를 이해하고 결론을 도출하는 데 중요한 역할을 합니다. 이번 글에서는 기술 통계와 추론 통계의 핵심 개념과 방법들을 살펴보겠습니다.기술 통계기술 통계는 데이터를 요약하고 설명하는 방법입니다. 데이터의 대략적인 특징을 간단하고 쉽게 알 수 있으며, 데이터셋의 대표적인 값을 도출하는 데 유용합니다. 단, 예외(이상치)가 항상 존재할 수 있고 데이터의 모든 부분을 완벽하게 설명하지는 못할 수 있습니다.평균평균은 데이터셋의 모든 값을 더한 후 데이터의 개수로 나누어 계산합니다. 이는 데이터의 일반적인 경향을 파악하는 데 유용합니다.예시: 학생들의 수학 점수가 70, 80, 9.. 2024. 8. 1.
데이터 분석에서 통계가 중요한 이유 데이터 분석은 현대 비즈니스와 연구의 중요한 요소로 자리 잡고 있습니다. 그 중심에는 통계가 있으며, 통계는 데이터를 이해하고 해석하는 데 중요한 역할을 합니다. 다음은 데이터 분석에서 통계가 왜 중요한지에 대한 몇 가지 이유와 예시입니다.  왜 통계가 중요한가? Why? 데이터 이해 및 해석: 통계는 데이터의 구조와 특성을 이해하는 데 필수적입니다. 데이터의 분포, 중앙값, 평균값, 표준편차 등을 통해 데이터의 본질을 파악할 수 있습니다. 이를 통해 데이터의 패턴과 특성을 이해하고, 올바른 분석을 수행할 수 있습니다.데이터 요약 및 패턴 발견: 대량의 데이터를 요약하고 시각화하는 데 통계 기법이 활용됩니다. 히스토그램, 박스 플롯, 분산도 등 다양한 시각적 도구를 통해 데이터의 주요 패턴을 쉽게 발견할.. 2024. 8. 1.