一个简单的语音识别实现
测试音频
链接:http://pan.baidu.com/s/1o8Ue4B4 密码:o5r1 ]
注意事项
音频格式限制
pcm(不压缩)、wav、amr采样频率及位数
支持评测 8k/16k 采样率 16bit 位深的单声道语音(这个采样频率支持确实不太友好,大部分手机和电脑录音的现在都是44KHz了)
安装SDK
可以直接pip安装
pip install baidu-aip
接口调用
# 引入Speech SDKfrom aip import AipSpeechimport os path = 'D:/data/VoiceRecog/'os.chdir(path)# 定义常量APP_ID = '你的 App ID'API_KEY = '你的 API Key'SECRET_KEY = '你的 Secret Key'# 初始化AipSpeech对象aipSpeech = AipSpeech(APP_ID, API_KEY, SECRET_KEY)# 读取文件def get_file_content(filePath): with open(filePath, 'rb') as fp: return fp.read()# 识别本地文件#aipSpeech.asr(get_file_content('demo0.wav'), 'wav', 16000, {'lan': 'zh',})#遍历文件夹中的wav并进行识别for dir in [x for x in os.listdir(path) if x[-1]=='v']: print dir try: t = aipSpeech.asr(get_file_content(dir), 'wav', 16000, { 'lan': 'zh',}) #print t print t['result'][0] except: print 'error ,pass'
识别结果:
demo0.wav
没有,你除了关心这个还关心过什么人是肉长的,如果再这样下去也没有什么意思了,
demo1.wav
18012345678,
demo2.wav
中美数控,
0条评论