当前位置：白度搜_经验知识百科全书 > 百科知识 > 百科大全 > 一个简单的语音识别实现

admin 百科大全 2022-12-11 14:48:56

一个简单的语音识别实现

测试音频

链接：http://pan.baidu.com/s/1o8Ue4B4 密码：o5r1 ]

注意事项

音频格式限制
pcm（不压缩）、wav、amr
采样频率及位数
支持评测 8k/16k 采样率 16bit 位深的单声道语音（这个采样频率支持确实不太友好，大部分手机和电脑录音的现在都是44KHz了）

安装SDK

可以直接pip安装

pip install baidu-aip

接口调用

# 引入Speech SDKfrom aip import AipSpeechimport os
path = 'D:/data/VoiceRecog/'os.chdir(path)# 定义常量APP_ID = '你的 App ID'API_KEY = '你的 API Key'SECRET_KEY = '你的 Secret Key'# 初始化AipSpeech对象aipSpeech = AipSpeech(APP_ID, API_KEY, SECRET_KEY)# 读取文件def get_file_content(filePath):
    with open(filePath, 'rb') as fp:        return fp.read()# 识别本地文件#aipSpeech.asr(get_file_content('demo0.wav'), 'wav', 16000, {'lan': 'zh',})#遍历文件夹中的wav并进行识别for dir in [x for x in os.listdir(path) if x[-1]=='v']:    print dir    try:
        t = aipSpeech.asr(get_file_content(dir), 'wav', 16000, { 'lan': 'zh',})        #print t
        print t['result'][0]    except:        print 'error ,pass'

识别结果：

demo0.wav
没有,你除了关心这个还关心过什么人是肉长的，如果再这样下去也没有什么意思了，
demo1.wav
18012345678，
demo2.wav
中美数控，

wav aipspeech demo

DABAN RP主题是一个优秀的主题，极致后台体验，无插件，集成会员系统
白度搜_经验知识百科全书 » 一个简单的语音识别实现

admin 管理员组

分享到：

0条评论

发表评论取消回复

要发表评论，您必须先登录。

提供最优质的资源集合

立即查看了解详情