小智Ai是虾哥开源的一款ai智能对话机器人原型硬件,使用最少的esp32-s3主板加全向麦克风喇叭。就可以完成联网与大模型交流语音输出。
可以使用的大模型主要在后端配置,目前阿里云开源的qwen模型、deepseek v3等。
目前虾哥开源整个硬件和固件以及固件源码。但没有开源服务端后台,但有人根据固件请求接口模拟了一个后台并开源了。
我从立创商城买了一个立创esp32_s3主板,带屏幕和摄像头。集成麦克风与喇叭,没有带电池和4g模块。
配上电池和其他外设就可以做成一个移动小玩具了。
小智AI 开源开源固件地址:https://github.com/78/xiaozhi-esp32
资料库:https://ccnphfhqs21z.feishu.cn/wiki/F5krwD16viZoF0kKkvDcrZNYnhb
服务端复刻:https://github.com/xinnan-tech/xiaozhi-esp32-server
小智AI后台:
https://xiaozhi.me/
1、购买固件立创esp32-s3:
https://oshwhub.com/li-chuang-kai-fa-ban/li-chuang-shi-zhan-pai-esp32-s3-kai-fa-ban
立创·实战派ESP32-S3开发板
简介:实战派S3开发板采用ESP32-S3芯片,配16MB FLASH、8MB PSRAM,集成GC0308摄像头、2寸IPS屏、电容屏及双音频芯片,含6D传感器、外拓接口、TF卡、USB-HUB,支持ai
硬件开源资料
https://wiki.lckfb.com/zh-hans/szpi-esp32s3/
2、准备数据线,下载刷机工具,串口驱动等。
乐鑫flash刷机工具:https://www.espressif.com.cn/zh-hans/support/download/other-tools
3、按照教程刷机:
https://ccnphfhqs21z.feishu.cn/wiki/Zpz4wXBtdimBrLk25WdcXzxcnNS
4、下载固件:选择 lichuang-dev 的bin文件
https://github.com/78/xiaozhi-esp32/releases
5、刷机
出现点点点,一定要按一下boot按键。
等待时间太长,等待期间不要乱操作,记录下操作过程。
怎么20分钟还没刷完?
点start检查后,需要按住主板上的boot按键,按3秒左右。
立创板卡是在右侧的那个boot按键,另一个按键是ret按钮,按会重启设备。
6、刷机完成配置网络:
https://ccnphfhqs21z.feishu.cn/wiki/KGvIwjTQxiTxPCkRbbjcPnsLnMb
配网完成后可以按Rst键重启一下主板,会出现一个验证码。
7、配置小智后台
https://xiaozhi.me/
注册一个账号,并增加设备,输入设备的验证码,等会确认绑定成功后重启主板。
8、使用你好小智唤醒社保就可以与她交流了。
esp32-s3类的主板支持连续对话。
esp32-c类的主板好像需要每次按键与板卡交流。
9、如果想复刻项目可以参考软硬件和后端服务结合云服务资源进行复刻,云服务的持续是这个项目的关键,而本地设备则是较小的成本。
小智AI 开源:https://github.com/78/xiaozhi-esp32
资料库:https://ccnphfhqs21z.feishu.cn/wiki/F5krwD16viZoF0kKkvDcrZNYnhb
服务端复刻:https://github.com/xinnan-tech/xiaozhi-esp32-server