본문 바로가기

OpenAI Whisper1

STT(Speech To Text) 기술 오픈소스 및 예제(Google, OpenAI Whisper) STT(Speech To Text) 란 무엇인가요? 사람이 말하는 음성 언어를 컴퓨터가 해석해 그 내용을 문자 데이터로 전환하는 처리하는 것입니다. 아래와 같이 음성을 입력하면 전처리로 잡음처리 및 특징추출 후 음향모델과 언어모델, 발음사전 등을 이용한 디코더로 음성을 텍스트로 변환하여 결과를 내는 프로세스입니다. STT는 어디에 쓰일까요? 기본적으로 STT는 회의록, 유튜브자막, 인터뷰, 통화녹취, 상담기록, AI 스피커 등에 사용됩니다. VUI라고도 불리는 Voice User Interface에서도 사람의 음성을 인식하여 처리하는 방식에 사용되기도 합니다. "Siri야"나 "하이 빅스비"와 같이 핸드폰 조작이나 차량 음성인식 같은 곳에서 음성추출 후 해당 문장의 내용을 바탕으로 액션을 취하는 분야도 .. 2023. 8. 31.

이전 1 다음

티스토리툴바