[AI,코딩]
Open AI Whisper API란? 사용법 및 응용법
조아라세연
2023. 5. 30. 15:30
반응형

OpenAI의 자동 음성 인식 Whisper는 딥 러닝을 기반으로 개발된 음성 인식 AI입니다. Whisper는 녹음된 음성 파일을 인식하고 텍스트로 변환할 수 있습니다. Whisper는 배경 소음이 많은 환경에서도 정확하게 음성을 인식할 수 있습니다. Whisper는 다양한 용도로 사용할 수 있습니다.
사용법 (Python)
유료 : $0.006/ 분 (분당 약 8원)
1. Whisper 설치
(pip3 install setuptools-rust)
(pip3 install git+https://github.com/openai/whisper.git)
2. Whisper 불러오기
(import whisper)
(model = whisper.load_model('base'))
3. 영상 불러오기
(result = model.transcribe(‘파일명.m4a')
(print(result['text']))
응용법
1. 녹음된 회의 내용을 텍스트로 변환하여 회의록을 작성하는 데 사용할 수 있습니다.
2. 음성으로 명령을 내리는 음성 인식 장치에 API를 사용할 수 있습니다.
3. 영상에 자동으로 자막을 만들 수 있습니다.
728x90