123,123

意法半導(dǎo)體ToF傳感器的3D手勢(shì)識(shí)別

2022-11-14 1666次

手勢(shì)識(shí)別是計(jì)算機(jī)科學(xué)和語(yǔ)言技術(shù)領(lǐng)域的一個(gè)研究課題，其目的是通過數(shù)學(xué)算法解析人類手勢(shì)。它可以在機(jī)器和人類之間搭建更高效的溝通橋梁，讓生活更豐富多彩、更智能化。人們?cè)诨趫D像/視頻的手勢(shì)識(shí)別方面已經(jīng)做了大量研究(通常使用2D攝像機(jī))，今天我們將討論新的解決方案 - 基于ToF傳感器的3D手勢(shì)識(shí)別。

在新冠疫情肆虐的當(dāng)前形勢(shì)下，人們對(duì)“非接觸式”解決方案用戶界面的要求越來越高，同時(shí)保持社交距離正成為“新常態(tài)”;然而在日常生活中，我們?nèi)匀恍枰佑|公共場(chǎng)所中的多個(gè)目標(biāo)，特別是使用ATM機(jī)、自動(dòng)售貨機(jī)、工廠機(jī)器等設(shè)備的界面。將意法半導(dǎo)體的新型傳感技術(shù)和強(qiáng)大的人工智能算法結(jié)合之后，我們可以通過3D手勢(shì)識(shí)別演示實(shí)現(xiàn)此解決方案。讓我們看看演示過程。

演示概述

該演示目前能夠識(shí)別8種手勢(shì)，包括：向左滑動(dòng)、向右滑動(dòng)、向上滑動(dòng)、向下滑動(dòng)、單擊、雙擊、順時(shí)針旋轉(zhuǎn)和逆時(shí)針旋轉(zhuǎn)。

我們采用意法半導(dǎo)體的最新飛行時(shí)間(ToF)8X8多區(qū)域測(cè)距傳感器VL53L5CX作為輸入，然后在STM32上運(yùn)行深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)算法，最后在PC GUI上顯示識(shí)別結(jié)果。

在硬件方面，我們組合運(yùn)用STM32F401RC Nucleo板和VL53L5 EVK擴(kuò)展板。

輸入傳感器

VL53L5CX是先進(jìn)的飛行時(shí)間(ToF)多區(qū)域測(cè)距傳感器，壯大了意法半導(dǎo)體的FlightSense產(chǎn)品陣容。該產(chǎn)品是意法半導(dǎo)體今年最新發(fā)布一款ToF傳感器。

? 特性：

快速、精確的多區(qū)域測(cè)距傳感器

– 多區(qū)域測(cè)距輸出可覆蓋4x4或8x8個(gè)單獨(dú)區(qū)域

– 自主低功耗模式，通過可編程中斷閾值喚醒主機(jī)

– 范圍可達(dá)400 cm

完全集成的微型模塊，具有寬視野(FoV)

– 發(fā)射器：940nm不可見光垂直腔面發(fā)射激光器(VCSEL)和集成模擬驅(qū)動(dòng)器

– 在發(fā)射器和接收器上使用衍射光學(xué)元件(DOE)的63 °對(duì)角視野FoV

– 大?。?/span>6.4 x 3.0 x 1.5 mm

方便集成

– 單回流焊元件

– 靈活的電源選擇，單個(gè)3.3 V或2.8 V操作或3.3 V或2.8 V AVDD與1.8 V IOVDD組合

采集與標(biāo)記數(shù)據(jù)集

獲取足夠數(shù)量的關(guān)于不同手勢(shì)的代表性數(shù)據(jù)對(duì)于訓(xùn)練人工神經(jīng)網(wǎng)絡(luò)模型是非常重要的。

當(dāng)執(zhí)行一個(gè)手勢(shì)動(dòng)作時(shí)，我們可以通過使用Python語(yǔ)言開發(fā)的特定GUI輕松從ToF傳感器獲取并標(biāo)記原始數(shù)據(jù)，并創(chuàng)建自己的數(shù)據(jù)集。

該數(shù)據(jù)集包含了每種手勢(shì)(我們的演示中有8種：向左滑動(dòng)、向右滑動(dòng)、單擊、雙擊、順時(shí)針旋轉(zhuǎn)、逆時(shí)針旋轉(zhuǎn)、向上滑動(dòng)、向下滑動(dòng))的數(shù)千個(gè)樣本，這些手勢(shì)由少數(shù)幾人提供。

顯然，如果你希望創(chuàng)建自定義的手勢(shì)，也可以使用相同的工具為這個(gè)手勢(shì)創(chuàng)建新的數(shù)據(jù)集。

構(gòu)建和訓(xùn)練神經(jīng)網(wǎng)絡(luò)

對(duì)于神經(jīng)網(wǎng)絡(luò)部分，我們選擇運(yùn)用簡(jiǎn)單、靈活、功能強(qiáng)大的Keras框架構(gòu)建神經(jīng)網(wǎng)絡(luò)。因?yàn)槭謩?shì)是一種順序動(dòng)作，所以我們選擇CNN + GRU層來創(chuàng)建模型，經(jīng)過大約50個(gè)epoch的訓(xùn)練，我們訓(xùn)練和驗(yàn)證數(shù)據(jù)集的準(zhǔn)確率可達(dá)到95%以上，而損失僅有0.08左右，已經(jīng)很不錯(cuò)了。對(duì)于測(cè)試數(shù)據(jù)集，我們也可以針對(duì)每種手勢(shì)獲得不錯(cuò)的準(zhǔn)確率。F1評(píng)分可達(dá)96%。

最后，我們可以將訓(xùn)練效果更好的模型和權(quán)重保存為gesture.h5的模型，以便在MCU端實(shí)施。

在MCU端實(shí)施手勢(shì)模型

? 先決條件：

需要在STM32CubeMX中安裝X-Cube-AI擴(kuò)展包。目前的最新版本是7.0.0，它也支持sklearn機(jī)器學(xué)習(xí)模型轉(zhuǎn)化。

? X-Cube-AI配置向?qū)В?/span>

配置完使用哪塊板件后，可以從軟件包->選擇組件加載X-Cube-AI，或使用快捷鍵Alt+O。

需在“Software packs component selector”窗口選中X-Cube-AI/Core 這個(gè)選項(xiàng)，才能調(diào)用神經(jīng)網(wǎng)絡(luò)模型并生成相關(guān)的STM32 NN庫(kù)。單擊[OK]，完成選擇。如下圖所示：

? 啟用X-CUBE-AI組件：

單擊[STMicroelectronics X-CUBE-AI 7.0.0] 打開初始AI配置窗口。選中 [Artificial Intelligence X-CUBE-AI] ，啟用X-CUBE-AI內(nèi)核組件。還必須選中[Device Application]，才能添加AI插件應(yīng)用程序。

? 加載神經(jīng)網(wǎng)絡(luò)(NN)：

1.添加網(wǎng)絡(luò)。

2.將模型名稱改為“gesture”。

3.選擇“Keras”作為輸入模型類型。

4.點(diǎn)擊“Browse”按鈕以選擇要實(shí)現(xiàn)的模型。gesture.h5

5.點(diǎn)擊“Analyze”按鈕以分析模型。

分析完畢后，將顯示模型層詳細(xì)報(bào)告，還附有該模型需要使用的MACC、flash、ram信息。

最后，在CubeMX中點(diǎn)擊“生成代碼”，然后會(huì)在您的項(xiàng)目中創(chuàng)建一個(gè)X-CUBE-AI文件夾，可以在該文件夾中找到一些有用的文件。

包括拓?fù)渚W(wǎng)絡(luò)的gesture.c和gesture.h文件。

包括權(quán)重/偏差的gesture_data.c和gesture_data.h文件。

app_x-cube-ai.c and app_x-cube-ai.h 文件還提供AI客戶端應(yīng)用程序可以使用的通用多網(wǎng)絡(luò)推理API接口。

如果后續(xù)需要更新數(shù)據(jù)集或是重新訓(xùn)練更新權(quán)重以獲得更好的性能效果，只要更新gesture_data.c和gesture_data.h文件就可以。所以，更新過程很方便的。

顯示結(jié)果

最后，將uart日志打印到PC端，從而在GUI端顯示我們的預(yù)測(cè)結(jié)果。當(dāng)您在距離自己20~80cm的ToF傳感器前做一個(gè)順時(shí)針旋轉(zhuǎn)的手勢(shì)時(shí)，GUI將會(huì)顯示預(yù)測(cè)結(jié)果，如下所示。百分比是該手勢(shì)的概率。

3D手勢(shì)演示到這里已經(jīng)結(jié)束，該解決方案可用于以下幾個(gè)應(yīng)用場(chǎng)景。

●智能家電：當(dāng)您的手上臟或濕的時(shí)候，通過手勢(shì)識(shí)別控制不同的家電。

●交互式娛樂：如游戲機(jī)。

●人機(jī)交互：讓機(jī)器更智能，讓人更安全，特別是在新冠病毒肆虐的環(huán)境或一些危險(xiǎn)環(huán)境中。

現(xiàn)在，您可以嘗試使用VL53L5傳感器、STM32開發(fā)板、以及強(qiáng)大的X-Cube-AI庫(kù)創(chuàng)建自己的手勢(shì)識(shí)別演示。我們正在一些活動(dòng)中展示該演示項(xiàng)目;如果您對(duì)我們的手勢(shì)演示感興趣，請(qǐng)聯(lián)系意法半導(dǎo)體的AI創(chuàng)新應(yīng)用中心，我們會(huì)選定目標(biāo)客戶根據(jù)產(chǎn)品的特定用例對(duì)該演示進(jìn)行產(chǎn)品級(jí)支持。

STM32 MCU優(yōu)化的STM32Cube.AI庫(kù) 上一篇下一篇 STM32WB利用Opus實(shí)現(xiàn)BLE全雙工語(yǔ)音流

最新文章

ST LIS331DLH：高性能超低功耗三軸MEMS加速度計(jì)詳解

ST意法半導(dǎo)體推出的LIS331DLH是一款超低功耗高性能三軸線性加速度計(jì)，屬于其著名的“nano”系列MEMS傳感器產(chǎn)品。這款器件采用先進(jìn)的微機(jī)電系統(tǒng)技術(shù)，在微型化封裝中實(shí)現(xiàn)了卓越的運(yùn)動(dòng)感知能力。其3×3×1mm的超緊湊尺寸和僅20mg的重量，使它在消費(fèi)電子和工業(yè)控制領(lǐng)域獲得了廣泛應(yīng)用。

2025-05-29 337次

?意法半導(dǎo)體STM32N657Z0H3Q：重新定義高性能嵌入式系統(tǒng)的未來?

在物聯(lián)網(wǎng)（IoT）、工業(yè)自動(dòng)化及人工智能（AI）技術(shù)飛速發(fā)展的今天，嵌入式系統(tǒng)的性能、能效與集成度成為開發(fā)者關(guān)注的核心。意法半導(dǎo)體（STMicroelectronics）作為全球半導(dǎo)體行業(yè)的領(lǐng)軍企業(yè)，近期推出的?STM32N657Z0H3Q?微控制器，以其突破性的架構(gòu)設(shè)計(jì)、多領(lǐng)域適應(yīng)性及卓越的能效表現(xiàn)，為下一代智能設(shè)備樹立了全新標(biāo)桿。本文將深入剖析這款產(chǎn)品的核心優(yōu)勢(shì)與技術(shù)亮點(diǎn)。

2025-05-06 371次

意法半導(dǎo)體STM32N657L0H3Q:集成專用AI加速單元,專為高效計(jì)算

意法半導(dǎo)體STM32N657L0H3Q是STM32N6系列中的一款高性能微控制器（MCU），專為需要高效計(jì)算與人工智能加速的場(chǎng)景設(shè)計(jì)。作為ST首款集成專用AI加速單元的產(chǎn)品，其融合了Cortex-M55內(nèi)核、Neural-ART NPU及多項(xiàng)創(chuàng)新技術(shù)，推動(dòng)工業(yè)自動(dòng)化、智能硬件等領(lǐng)域的邊緣計(jì)算能力升級(jí)。

2025-05-06 456次

意法半導(dǎo)體STM32N657B0H3Q：專為?邊緣AI與高性能計(jì)算場(chǎng)景?設(shè)計(jì)

STM32N657B0H3Q是意法半導(dǎo)體（STMicroelectronics）推出的?STM32N6系列旗艦級(jí)微控制器?，專為?邊緣AI與高性能計(jì)算場(chǎng)景?設(shè)計(jì)。其核心亮點(diǎn)包括集成?NPU（神經(jīng)處理單元）?、大容量片上SRAM、以及多媒體處理引擎，目標(biāo)應(yīng)用涵蓋智能眼鏡、工業(yè)視覺、車載電子等領(lǐng)域。

2025-05-06 932次

意法半導(dǎo)體STM32N657I0H3Q微控制器深度解析

STM32N657I0H3Q是意法半導(dǎo)體（STMicroelectronics）推出的高性能ARM Cortex-M55內(nèi)核微控制器（MCU），屬于STM32N6系列中的旗艦型號(hào)。該芯片采用16nm FinFET先進(jìn)制程工藝，主頻高達(dá)800MHz，集成4.2MB連續(xù)SRAM，并融合了神經(jīng)網(wǎng)絡(luò)加速器、圖形處理單元（GPU）及多模態(tài)外設(shè)接口，專為實(shí)時(shí)信號(hào)處理、邊緣AI及復(fù)雜嵌入式系統(tǒng)設(shè)計(jì)。

2025-04-30 880次

更多資訊

熱門資訊

萬(wàn)聯(lián)芯微信公眾號(hào)

元器件現(xiàn)貨+BOM配單+PCBA制造平臺(tái)

關(guān)注公眾號(hào)，優(yōu)惠活動(dòng)早知道！

* 我的問題/建議：
* 聯(lián)系電話：
上傳圖片（選填）：	請(qǐng)您提交2M以內(nèi)的jpg,gif,png格式文件
投訴訂單號(hào)（選填）：

h1_key

萬(wàn)聯(lián)芯微信公眾號(hào)

4000-306-326