목록데이터 (1)
어쩌면 일지
데이터 전처리 하는 법
전처리 과정 수집한 데이터를 학습에 적합한 형태로 가공하기 위해서는 전처리 과정이 필요하다. 전처리 과정은 텍스트 데이터에서 필요한 정보를 추출하고, 불필요한 정보를 제거하는 등의 과정을 포함한다. 1. 텍스트 데이터 정제 텍스트 데이터 정제는 텍스트에서 불필요한 부분을 제거하는 과정이다. 예를 들어, 대화형 광고를 만들기 위한 대화 데이터라면, 대화의 시작 부분이나 끝 부분에 있는 인사말이나 종료말 등은 제거할 필요가 있다. 또한, 특수 문자나 이모지, 태그 등은 학습에 방해가 되므로 제거하는 것이 좋다. 2. 언어 모델의 입력 형태로 변환 전처리된 데이터를 언어 모델의 입력 형태로 변환해야 한다. 대부분의 언어 모델은 일정한 형식의 입력을 필요로 한다. 예를 들어, GPT 모델의 입력 형식은 다음과 ..
[AI,코딩]
2023. 4. 12. 17:55