openai-whisper

https://github.com/openai/whisper

Speach To Text

말소리를 듣고 텍스트로 바꿔주는 기술 openai가 오픈소스로 제공하는 ai모델과 라이브러리들이다.

이걸 가지고 ai에 관련됱 내용을 공부해볼 계획이다.

목차

  1. 일단 실행해보기

  2. server setup

  3. api만들기

    1. fastapi를 사용해서 helloworld 보여주기

    2. file을 받아서 처리한후 보여주기

    3. 큐도 만들어야할거같은데?

    4. 한글 / 영어 언어 인식하기

    5. 프롬프트도 지원

  4. realtime으로 처리하기

  5. fine tunning (미세 조정)으로 성능 올리기 - 모델이 변경될듯

  6. app에서 api를 호출하여 실시간으로 텍스트로 바꿔보기

Last updated