硬汉嵌入式论坛

 找回密码
 立即注册
查看: 2087|回复: 3
收起左侧

[Zephyr] 聆思CSK6语音视觉AI大模型开发板硬件详解(附硬件资料下载)

[复制链接]

13

主题

3

回帖

42

积分

新手上路

积分
42
发表于 2024-6-12 17:19:42 | 显示全部楼层 |阅读模式
本帖最后由 ListenAI 于 2024-6-13 15:25 编辑


视觉语音大模型 AI 开发套件( CSK6-MIX )是围绕 CSK6011A 芯片设计的具备丰富语音图像功能与硬件外设的开发板,采用具备丰富组件生态的 Zephyr RTOS作为操作系统,官方提供了十几种开源SDK,包含大模型语音交互、大模型拍照识图、文生图、人脸识别、头肩追踪、手势识别、坐姿提醒等。
聆思科技还提供了模型训练推理工具将自己的算法模型部署至芯片上,也可以配合这个工具构建自己的 AI 应用。
功能特性功能概述
● 使用聆思 CSK6011A 芯片作为主控,板载 16MB Flash
● 集成摄像头、麦克风、扬声器、屏幕等丰富外设配件
● 配套多模态应用示例,支持快速上手体验大模型语音交互、智能视觉等 AI 应用
● 板载 DAPLINK 调试器,外接一条USB 线即可实现烧录、调试、串口日志查看
● 板载网络模组,支持开发联网类应用
大模型示例SDK清单
SDK集成了星火大模型,可以二次开发改接其他大模型,示例清单见下表,可以直接通过链接进行固件烧录并下载:

序号
大模型功能
使用教程
功能说明
1
大模型多模态
https://docs2.listenai.com/x/2V18-j2v2
套件出厂默认应用。包含大模型语音问答、拍照识图、大模型绘图等丰富供能示例,支持语音唤醒、多轮语音交互。
2
智能对话
https://docs2.listenai.com/x/W-UwdIBzk
除了大模型语音对话,还集成了可离线运行的坐姿检测算法,是一个 大模型在线服务+离线AI能力 的示例。
3
智能对话 + 文生图 + 设备控制
https://docs2.listenai.com/x/1PjldCQrN
该示例展示了如何通过大模型实现语音输入意图的理解,实现对话、绘图和控制开发板屏幕颜色进行切换,用户可参考代码与教程自行修改。
4
接入自定义应用
https://docs2.listenai.com/x/BDir5bLbD
https://docs2.listenai.com/x/swDsUBmPO
讲解如何在云端快速建立一个自定义大模型应用并接入到开发套件上实现语音交互,由浅入深地展示如何开发自己的大模型助手。


离线AI能力示例SDK清单
序号
AI 能力
使用教程
1
语音唤醒 + 坐姿检测
https://docs2.listenai.com/x/i_84jJ5pd
2
语音合成
https://docs2.listenai.com/x/ff3F2nK3w
3
坐姿检测
https://docs2.listenai.com/x/e16RmshY3
4
人脸识别
https://docs2.listenai.com/x/XuPPPS80c
5
单词评测
https://docs2.listenai.com/x/hZ6NT04Kk
6
头肩检测 & 手势识别
https://docs2.listenai.com/x/eiRAtqX7_
LNN AI示例SDK清单
LNN是用于移植适配算法至CSK6芯片的工具,提供了视觉、语音相关的示例SDK,如果想在CSK6上移植适配自己的算法,可以参照这些示例:
序号
能力
使用教程
1
拍照物体识别
https://docs2.listenai.com/x/AyRl56jpS
2
鼾声检测
https://docs2.listenai.com/x/tD4HR_HpM
3
英译中
https://docs2.listenai.com/x/GxlJsvPfc
开发板硬件资源
(硬件资源图示请看图片附件)
编号
资源
说明
1
CSK USB 接口
CSK6 芯片的 USB 接口,可通过本接口使用 CSK6 的 USB 硬件功能,支持对开发板进行供电。
2
DAPLink 调试器接口
可通过本接口查看日志、烧录固件、调试仿真,支持对开发板进行供电。
3
电源开关
控制开发板总电源开关。
4
外扩排针
引出 CSK6 芯片的可用 IO 口,包括部分由扩展 IO 芯片 (19编号)外接的 IO口,开发者可按需进行使用。
5
摄像头模组
默认配套 30W 像素的摄像头模组,型号为 GC0328。
6
扬声器接口
用于连接扬声器进行播音。
7
RGB LED
支持编程控制的 LED。
8
触摸显示屏
分辨率 320*240 的触摸显示屏,屏显硬件接口为 SPI,触摸硬件接口为 I2C 。
9
麦克风
板载的两个麦克风,连接芯片的 Audio ADC,用于语音相关应用的录音。
10
硬回采开关
用于控制第二路录音链路用于麦克录音(默认)还是硬件回采。
11
SD卡槽
用于插入 SD 存储卡。
12
网络模组调试座
可用语烧录网络模组的固件与调试。
13
网络模组
使用 ESP32 C3 作为网络模组。
14
扩展按键区
通过扩展 IO 芯片 CH32 扩展引出的按键,支持轮询检测。
15
CSK6 功能按键区
包括 CSK6 芯片的复位、BOOT、自定义功能按键。
16
电源LED
指示开发板的供电状态,供电正常使,LED亮起。
开发板设计资料下载
文件
操作
大模型开发套件
V2.0 硬件设计
https://oshwhub.com/lshuangyu/leaf-technology-multimodal-devel
CSK6系芯片
引脚功能表 V1.0
https://docs2.listenai.com/zz/3294.xlsx?shortId=nTn9kMMCU
附件大纲:
功能概述
├──大模型示例SDK清单
├──离线AI能力示例SDK清单
├──LNN AI示例SDK清单
开发板硬件资源
开发板设计资料下载
开发板尺寸V2.0
开发板配件
├──摄像头模组

├──摄像头安装

├──触摸屏模块

├──触摸屏安装

├──网络模组
更多使用说明
├──供电
├──DAPLink UsB口的使用
开发环境


开发板.png

硬件资源图示

硬件资源图示

聆思CSK6语音视觉AI大模型开发板硬件介绍.pdf

1.07 MB, 下载次数: 3

回复

使用道具 举报

1万

主题

7万

回帖

11万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
115456
QQ
发表于 2024-6-12 20:00:28 | 显示全部楼层
谢谢楼主分享

图片要单独上传,否则楼主的图片看不到。
回复

使用道具 举报

13

主题

3

回帖

42

积分

新手上路

积分
42
 楼主| 发表于 2024-6-13 10:35:27 | 显示全部楼层
eric2013 发表于 2024-6-12 20:00
谢谢楼主分享

图片要单独上传,否则楼主的图片看不到。

好的,感谢提醒
回复

使用道具 举报

0

主题

1

回帖

1

积分

新手上路

积分
1
发表于 2024-7-12 20:19:20 | 显示全部楼层
智能语音识别芯片,谢谢!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|Archiver|手机版|硬汉嵌入式论坛

GMT+8, 2025-4-27 02:19 , Processed in 0.550844 second(s), 32 queries .

Powered by Discuz! X3.4 Licensed

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表