一个由"虾哥"发起、社区共建的开源AI语音助手项目,正在以惊人的速度成长——GitHub 27,700+ Stars,6,200+ Forks,70+ 硬件支持,以及一个蓬勃发展的多端客户端生态。
2025-2026年,AI硬件创业热度不减,但大多数产品要么价格高昂,要么生态封闭。而小智AI(xiaozhi.me) 走了完全不同的路——完全开源、社区驱动、硬件友好。

这个由"虾哥"(GitHub: 78)发起的项目,最初只是一个基于ESP32的语音对话实验,如今已演变成一套完整的AIoT生态:ESP32固件 + 云端服务 + 多语言客户端 + MCP协议设备控制。更令人惊讶的是,官方服务器对个人用户免费开放,注册即可使用通义千问(Qwen)实时模型。
如果你是嵌入式开发者、Flutter工程师、AI产品经理,或者仅仅是一个想DIY一个AI小伙伴的创客——这篇文章将为你揭开小智AI生态的全貌。
小智AI的硬件端基于乐鑫 ESP-IDF 框架开发,核心架构为流式ASR + LLM + TTS:
| 层级 | 技术 | 说明 |
|---|---|---|
| 语音采集 | 麦克风 → OPUS编码 | 16kHz采样,60ms帧长 |
| 语音识别 (ASR) | 流式ASR | 实时语音转文字 |
| 大模型 (LLM) | Qwen / DeepSeek | 免费使用通义千问实时模型 |
| 语音合成 (TTS) | 流式TTS | 文字实时转语音播放 |
| 通信协议 | WebSocket / MQTT+UDP | 双协议栈,支持长连接 |
| 设备控制 | MCP协议 | 控制LED、舵机、GPIO等 |

小智AI最大的技术亮点之一,是全面采用 MCP(Model Context Protocol) 协议。这使AI不仅能"说话",还能"动手":
这意味着你可以用语音命令让ESP32设备帮你关灯、查邮件、控制机器人狗的舵机——而这一切都通过统一的MCP协议完成。
小智AI已兼容超过70种开源硬件,覆盖乐鑫全系芯片:
项目还提供免开发环境的固件烧录方案,新手只需下载固件、连接USB、刷入即可。官方服务器 xiaozhi.me 自动提供免费的Qwen实时模型。
此外,社区还贡献了多种服务端实现:
如果说ESP32固件是小智AI的"身体",那TOM88812的Flutter客户端就是它的"灵魂窗口"。这个项目在GitHub上获得了1,500+ Stars和390+ Forks,是小智生态中最重要的移动端实现。

TOM88812选择Flutter是一个极其聪明的决定:
TOM88812的客户端远不止"语音对话"这么简单。以下是V3商业版的功能全景:
| 模块 | 功能 | 状态 |
|---|---|---|
| 🤖 多AI服务 | 支持OpenAI、MiniMax、Dify等多服务商 | ✅ |
| 🎤 实时语音 | 流式ASR,支持对话中随意打断 | ✅ |
| 📱 多平台 | iOS/Android/Web/桌面端全适配 | ✅ |
| 🎨 Live2D | 多模型切换,支持导入自定义角色 | ✅ |
| 🧠 思考模式 | 支持OpenAI思考模式 | ✅ |
| 🔧 MCP Client | 支持MCP能力调用,接口DIY | ✅ |
| 🌐 联网搜索 | OpenAI接口联网搜索 | ✅ |
| 🎬 视频播放 | 播放模型返回的视频 | ✅ |
| 📡 MQTT+WS | 双协议支持,长连接 | ✅ |
| 🔌 IoT控制 | 调用手机功能、导航、音乐 | ✅ |
| 💼 设备管理 | 手机端管理所有设备、角色、声纹 | ✅ |
| 💾 记忆管理 | 长期记忆、对话记录查询 | ✅ |
| 🎯 声纹识别 | 手机端录制声纹,个性化语音助手 | ✅ |
| 💰 会员系统 | 支付宝/微信/PayPal在线支付 | ✅ |
TOM88812客户端的独特价值在于**"软硬一体"**:
# 克隆仓库
git clone https://github.com/TOM88812/xiaozhi-android-client.git
# 安装依赖
flutter pub get
# 运行
flutter run
# 构建发布版
flutter build apk --release # Android
flutter build ios --release # iOS
flutter build web --release # Web
项目文档站(tom88812.github.io/xiaozhi-android-client)提供了详细的功能概览和配置指南。
小智AI已经不仅仅是ESP32固件,而是一个完整的生态系统:
| 项目 | 说明 | Stars |
|---|---|---|
| 78/xiaozhi-esp32 | ESP32固件(C++) | 27.7k ⭐ |
| TOM88812/xiaozhi-android-client | Flutter移动端 | 1.5k ⭐ |
| xinnan-tech/xiaozhi-esp32-server | Python服务端 | 社区活跃 |
| 100askTeam/xiaozhi-linux | Linux桌面客户端 | 社区活跃 |
| 78/xiaozhi-assets-generator | 自定义唤醒词/表情/字体/背景 | 配套工具 |
| huangjunsen0406/py-xiaozhi | Python客户端 | 社区贡献 |
TOM88812客户端的V3商业版展示了清晰的变现路径:
小智AI的崛起不是偶然的。它精准地踩中了三个趋势:
而TOM88812的Flutter客户端,则填补了"硬件有脑、手机有脸"的最后一公里。
如果你手边有一块ESP32-S3开发板(淘宝不到50元),不妨花一个下午的时间:下载固件 → 刷入 → 注册xiaozhi.me → 安装TOM88812的App → 然后对着它说一声"你好,小智"。
那个瞬间,你会理解为什么27,700个人给这个项目点了Star。