C8550上运行YOLOv8-seg 该项目构建了一个cli应用程序,在C8550DK平台运行开源模型YOLOv8-seg-s,使用dsp以120ms/it的运行速度根据输入图像进行85类目标识别和语义分割。
8550DK 运行Stable Diffusion 该项目构建了一个cli应用程序,在C8550DK平台运行开源模型Stable Diffusion(v1.5),使用dsp以500ms/it的运行速度根据prompt进行图像生成的推理。
8380-MusicPlayer 该项目在8380开发板上构建运行Windows系统,并在此基础上构建一个简单、用户友好的音乐播放器,使用C#使用Windows窗体构建。它旨在为播放音乐库提供无缝直观的体验。
C6490-MobileVLM-cn MobileVLM 是一种强大的多模态视觉语言模型 (MMVLM),旨在在移动设备上运行。 它是无数面向移动的架构设计和技术的融合,其中包括一组从头开始训练的 1.4B 和 2.7B 参数规模的语言模型,以及在以下环境中预训练的多模态视觉模型: 通过高效投影仪进行 CLIP 时尚、跨模态交互。 根据几个典型的 VLM 基准评估 MobileVLM。 与一些更大的模型相比,模型表现出了同等的性能。
C8550-风格迁移示例 该项目在C8550开发板上构建并运行C8550 发展工具包系统的源代码,充分利用了发展工具包的多样性及其强大的连接和计算能力。Style Transfer 可以把自己需要处理的图片,根据选择的风格,把图片渲染为跟风格一致的图片。
CM2290-数字识别 该项目在cm2290开发板上构建并运行cm2290发展工具包系统的源代码,充分利用了发展工具包的多样性及其强大的连接和计算能力。这是使用TensorFlow构建的数字分类器模型的端到端示例2.0(Keras API),并在MNIST数据集上进行训练。示例应用程序允许用户画一个数字并预测它将是哪个数字。
CM2290-交互式图像分割 该项目在cm2290开发板上构建并运行cm2290发展工具包系统的源代码,充分利用了发展工具包的多样性及其强大的连接和计算能力。Interactive Segmentation 相机应用程序,它接受图像和该图像中的一个点,然后尝试确定周围的重要区域。
RB1_LaneDetection示例 项目以QRB2210开发工具包系统源代码为基础,运行在QRB2210开发板上,充分利用了开发工具包多样而强大的连接和计算能力。使用Opencv加载mp4视频文件,并对视频文件逐帧处理,识别每一帧图片中道路线条后做响应处理,处理后的视频帧输出为视频流文件。
RB1_ImageOCR示例 项目以QRB2210开发工具包系统源代码为基础,运行在QRB2210开发板上,充分利用了开发工具包多样而强大的连接和计算能力。使用Opencv加载image,并对image做二值化、去噪等预处理,通过Tesseract-OCR对与预处理后的image进行文字识别处理,并将结果保存为txt文件。
CM2290文本语义识别示例 该项目在cm2290开发板上构建并运行cm2290发展工具包系统的源代码,充分利用了发展工具包的多样性及其强大的连接和计算能力。它是使用在SQUAD 1.1数据集上微调的预训练文本分类模型创建的。 该模型以段落为输入,然后使用TensorFlow Lite模型将段落分类到预定义的组中,以预测段落的情绪是积极的还是消极的。它是在Mass等人提供的Large Movie Review Dataset v1.0上进行训练的。
RB1-艺术风格转换示例 项目以QRB2210开发工具包系统源代码为基础,运行在QRB2210开发板上,充分利用了开发工具包多样而强大的连接和计算能力。使用HostAPD和UDHCPD工具使能AP WIFI,使用GStreamer和ZLMediaKit完成RTSP流媒体功能,使用TFLITE完成art风格转移算法的推断。
CM2290-Bert QA示例 项目在cm2290开发工具包系统源码构建并运行在CM2290开发板上,充分利用了开发工具包多样而强大的连接能力以及运算能力。它是使用在SQuAD 1.1 数据集上微调的预训练 BERT 模型创建的, 该模型将一段文章和一个问题作为输入,然后返回最有可能回答问题的一段文章。它需要半复杂的预处理,在应用程序中实现的标记化和后处理步骤。
CM2290交通标志识别示例 项目在cm2290开发工具包系统源码构建并运行在CM2290开发板上,充分利用了开发工具包多样而强大的连接能力以及运算能力。通过HostAPD和UDHCPD工具使能AP WIFI,通过GStreamer、ZLMediaKit和FFMPEG完成RTSP流媒体功能,通过 TFLITE 完成 yolov5 交通标志识别模型的推理运行。
CM2290手势鉴别 项目依托CM2290开发工具包,充分利用CM2290丰富而强大的连接能力。通过MediaPipe model 通过识别手部的21个3D坐标,是目前最先进的方法推理,具有实时性能,甚至可以扩展到多只手。
WIFI 温湿度计 项目依托CM2290开发工具包,充分利用CM2290丰富而强大的连接能力。通过HostAPD和UDHCPD工具使能AP WIFI,通过mosquitto完成温湿度数据的传输。开发板打开wifi热点,运行mosquitto服务后,湿度计会主动连接wifi并上报数据。温度和湿度数据可以在一个简单的网页上查看。
CM2290图像识别 本项目依托CM2290开发套件,利用开发套件的AI计算能力和图像处理能力,图像分类模型和图像分类模型都使用图像作为输入,预测这些图像属于预定义类别的概率。 例如,一个图像运动识别模型可以被训练来识别不同颜色的电脑键盘、不同品牌的鼠标和不同尺寸的显示器。
口罩检测 依托QCS610开发工具包,利用开发工具包的AI计算能力和图像处理能力实时采集图像,预处理后进行AI推理,并输出推理结果。我使用gstreamer和TFLITE来完成上述功能。当管道获得有效的图像数据时,它会自动采集图像,进行AI推理,并返回口罩在图像帧中的位置信息。
姿势识别 本项目依托QCS610开发套件,利用开发套件的AI计算能力和图像处理能力,实时采集图像,预处理后进行AI推理,并输出推理结果。我使用gstreamer和Snapdragon Neural Processing Engine SDK来完成上述功能。当管道获得有效的图像数据后,自动采集图像,进行AI推理,返回人体姿态信息。
CM2290性能探索 本项目依托CM2290开发套件,利用开发套件的AI计算能力和图像处理能力,实时采集图像,预处理后进行AI推理,并输出推理结果。我使用gstreamer和tflite(支持NNAPI)来完成上述功能。使用在同一个局域网下面的RDS摄像头实时采集视频数据 通过按修改参数来设置App上显示多路摄像,以及是否掉帧,卡顿来评测CM2290 性能。
驾驶警告 本项目依托QCS610开发套件,利用开发套件的AI计算能力和图像处理能力,实时采集图像,预处理后进行AI推理,并输出推理结果。我使用gstreamer和tflite(支持NNAPI)来完成上述功能。前置摄像头采集人脸图像检测驾驶员疲劳状态,后置摄像头显示车外路况。
智能交通 使用高通®QCS610 SOC开放套件和IMX415相机模块。然后,结合高通的人工智能、OpenCV、SVM和Gstreamer、神经处理SDK,完成车牌识别过程,展示其强大的计算能力。将EasyPR车牌识别引擎以及高通神经处理SDK移植到Qualcomm®QCS610 SOC开发板上,展示Qualcomm®QCS610 SOC丰富的应用场景。同时利用GTK开发了用户界面,显示车牌识别的过程。