본문 바로가기
About Machine Learning

Data Augmentation 의 기능과 방법

by 용스토리랜드 2023. 5. 6.

데이터 증강(Data Augmentation)은 기존의 학습 데이터를 변형하여 새로운 학습 데이터를 생성하는 과정입니다. 데이터 증강의 주요 목적은 학습 데이터의 다양성을 높여 모델의 일반화 성능을 향상시키고, 과적합(Overfitting)을 방지하는 데 있습니다.

데이터 증강의 방법은 데이터의 종류와 문제에 따라 다양합니다. 대표적인 데이터 증강 방법은 다음과 같습니다.


이미지 데이터
이미지 데이터의 경우, 다양한 기하학적 변환 및 왜곡을 통해 데이터를 증강할 수 있습니다.
회전(Rotation): 이미지를 임의의 각도로 회전시킵니다.
이동(Translation): 이미지를 수평 또는 수직 방향으로 이동시킵니다.
좌우 반전(Flipping): 이미지를 수평으로 뒤집습니다.
확대/축소(Scaling): 이미지의 크기를 확대 또는 축소합니다.
밝기 조절(Brightness Adjustment): 이미지의 밝기를 조절하여 다양한 조명 상황을 반영합니다.
노이즈 추가(Noise Addition): 이미지에 노이즈를 추가하여 실제 환경에서 발생할 수 있는 노이즈에 강건한 모델을 학습시킵니다.


텍스트 데이터
텍스트 데이터의 경우, 단어의 순서를 변경하거나 동의어를 사용하여 데이터를 증강할 수 있습니다.
단어 삽입(Word Insertion): 문장에 임의의 단어를 삽입합니다.
단어 교체(Word Replacement): 문장의 일부 단어를 동의어로 교체합니다.
단어 삭제(Word Deletion): 문장에서 임의의 단어를 삭제합니다.
문장 셔플(Sentence Shuffling): 문장의 단어 순서를 변경합니다.


오디오 데이터
오디오 데이터의 경우, 속도 조절, 볼륨 조절, 노이즈 추가 등의 방법으로 데이터를 증강할 수 있습니다.
속도 조절(Speed Adjustment): 오디오의 재생 속도를 느리게 하거나 빠르게 합니다.
볼륨 조절(Volume Adjustment): 오디오의 볼륨을 조절하여 다양한 음량을 반영합니다.
노이즈 추가(Noise Addition): 오디오에 노이즈를 추가하여 실제 환경에서 발생할 수 있는 노이즈에 강건한 모델을 학습시킵니다.

반응형