当前位置:IT培训 > 华清远见教育科技集团 > 嵌入式学习 > 讲师博文 > Linux下科大讯飞语音识别全面总结
Linux下科大讯飞语音识别全面总结
时间:2018-05-14作者:华清远见

首先我们需要的就是Linux下的SDK的下载包,首先在科大讯飞的官网//www.xfyun.cn/注册,选择我们的语音识别的功能相应的Linux SDK下载,对应的生成Linux_iat1166_tts_online1166_5ad417ef.zip 的压缩包,然后解压缩如下:

bin目录下面是我们的生成的可执行的文件;

doc目录是我们的api函数接口的参考的文档;

include目录下面是我们的编译后的可执行文件用到的头文件;

libs是我们的程序用到的库;

samples目录下面是简单的语音合成、语音识别、语音转文字的demo;

切换到我们的samples下面的iat_record_sample的语音识别的demo,source 32bit_make.sh,在我们的bin目录下生成可执行文件iat_record_sample

但是执行时出现error while loading shared libraries: libmsc.so的错误

uame -a 或者uname -p查看我们的ubuntu虚拟机是32位还是64位的

再对应的将我们的libs目录下的库拷贝到/usr/libs下面

再运行我们的bin下面的生成的iat_record_sample可执行文件

但是我们demo只可以实现一次识别我们语音,故修改我们的代码让其可以一直等待输入,

并且每次等待输入的时间为10s钟,然后可以看到我们从本地的麦中发音,可以实现我们的语音转换为对应的文本

我们的main函数的login_params必须与我们自己申请的SDK的appid相同,不然云端在线时SDK与appid不一致无法使用语音的功能

为了实现一直输入,在我们的while(1)中调用demo_mic,其中demo_mic的sr_init、sr_start_listening、sr_stop_listening实现我们的语音的文件的起始和结束

sr_start_listening函数中的create_record、open_record、start_record、stop_record、close_record相关函数实现我们的录音对象的创建、打开、停止、关闭


发表评论

全国咨询电话:400-611-6270,双休日及节假日请致电值班手机:15010390966

在线咨询: 曹老师QQ(3337544669), 徐老师QQ(1462495461), 刘老师 QQ(3108687497)

企业培训洽谈专线:010-82600901,院校合作洽谈专线:010-82600350,在线咨询:QQ(248856300)

Copyright 2004-2018 华清远见教育科技集团 版权所有 ,京ICP备16055225号,京公海网安备11010802025203号

有位老师想和您聊一聊