< >
    首页

    fcitx5实现一个中文语音输入法

    我这几天为fcitx5实现一个中文语音输入法,由三部分组成:

    1. fcitx5输入法模块fcitx5-net,名字是net,显示图标是汉字“网”,作用是向goimserver发送录音指令和结束录音指令。
    2. 录音服务器goimserver,作用是按照fcitx5-net的指令录音,然后把录音发给asr-paddlespeech识别,再把识别结果发送给fcitx5-net
    3. 语音识别服务器asr-paddlespeech,用百度飞桨实现的著名语音AI-paddlespeech提供本地http语音识别服务。

    安装方法:

    一、安装fcitx5-net

    源代码地址是https://gitee.com/rocket049/fcitx5-net,为ubuntu24.04打包好的DEB包下载地址是https://gitee.com/rocket049/fcitx5-net/releases,其他系统可以自己编译或者把这个包重新打包以适应其他系统。

    二、安装goimserver

    源代码地址是https://gitee.com/rocket049/goimserver,为ubuntu24.04编译好的程序压缩包下载地址是https://gitee.com/rocket049/goimserver/releases,编译时需要安装portaudio19-devlibasound2-dev,运行只需要安装libporaudio2libasound2

    三、安装asr-paddlespeech

    源代码地址是https://gitee.com/rocket049/asr-paddlespeech,下载源代码后进入本目录,按照readme.txtpaddlespeech运行环境,然后运行脚本run-asr-server就可以了。脚本run-im-backend可以同时启动goimserverasr-paddlespeech,但是要先把goimserver程序链接或复制到本目录下。脚本close-im-backend用来关闭后台运行的goimserverasr-paddlespeech

    使用方法:

    安装fcitx5-net后,先运行脚本run-im-backend,然后把输入法切换到fcitx5-net,输入法名字是net,显示图标是汉字“网”,点一下右侧Ctrl,开始录音,结束时在按一次右侧Ctrl,识别结果就会直接输入到光标处。

    备案号:苏ICP备19034936号/ 苏ICP备19034936号-1/ 苏ICP备19034936号-2A    站长邮箱:fuhuizn@163.com   版权所有

    苏公网安备 32050702010684号

    Powered by MarkdownWeb