반응형
이전 포스팅에서 영상 파일 속 음성을 인식하였고, 이번에는 직접 마이크 출력을 통해 음성을 인식하도록 하겠습니다.
소스코드
import speech_recognition as sr
#import sys #-- 텍스트 저장시 사용
r = sr.Recognizer()
with sr.Microphone() as source:
print("Say Something")
speech = r.listen(source)
#sys.stdout = open('audio_output.txt', 'w') #-- 텍스트 저장시 사용
try:
audio = r.recognize_google(speech, language="ko-KR")
print("Your speech thinks like\n " + audio)
except sr.UnknownValueError:
print("Your speech can not understand")
except sr.RequestError as e:
print("Request Error!; {0}".format(e))
#sys.stdout.close() #-- 텍스트 저장시 사용
한글 음성을 기본으로 하였고, 필요에따라 텍스트 파일 출력이 가능하도록 하였습니다. 또한 불명확한 음성이나 요청 오류가 있을 시 예외 처리를 하도록 하였습니다.
테스트
단어의 경우 적절하게 인식하였을 때 띄어쓰기는 잘 되나, 마찬가지로 한줄로 출력이 됩니다.
txt 파일 생성하여 출력한 결과
단어 하나하나만의 출력은 기대 이상의 결과를 볼 수 있겠습니다.
번외 - 테스트 -> 음성 변환
from gtts import gTTS as gt
#speech = gt("This is test speech") #-- 영문 출력의 경우
speech = gt("안녕하세요.", lang = 'ko')
speech.save('say_hello.wav') #-- 출력 저장
반응형
'Python > Speech Recognition' 카테고리의 다른 글
[Python] Speech recognition 음성 인식 - 1 (0) | 2022.01.06 |
---|
댓글