ابداع عینکی برای مکالمه بدون صدا!

پژوهشگران دانشگاه «کرنل» موفق به ساخت عینک‌هایی شده‌اند که ارتباط صوتی بدون کلام را ممکن می‌سازد.
به نقل از نیواطلس، پژوهشگران دانشگاه «کرنل» فناوری جدیدی را توسعه داده‌اند که امکان برقراری ارتباط بی‌صدا را از طریق عینک‌های سونار فراهم می‌کند.
این عینک موسوم به EchoSpeech از میکروفون‌ها و بلندگوهای کوچکی برای خواندن کلماتی استفاده می‌کند که به شکل بی‌صدا از گلوی کاربر بیرون می‌آید و به کاربر اجازه می‌دهد تا کارهای مختلف را بدون نیاز به هرگونه ورودی فیزیکی انجام دهد.
اکنون یکی از هیجان‌انگیزترین چشم‌اندازهای این فناوری جدید این است که افراد مبتلا به ناتوانی گفتاری از آن برای گفتگوی بی‌صدا استفاده کنند که سپس این سیستم کلمات را با صدای بلند بیان می‌کند. این عینک همچنین می‌تواند برای کنترل پخش موسیقی در یک کتابخانه یا برای تبدیل گفتار به نوشتار در یک کنسرت پر سر و صدا که صدا به صدا نمی‌رسد، استفاده شود.این فناوری توسط یک دانشجوی دکترا در دانشگاه کرنل به نام رویدونگ ژانگ(Ruidong Zhang) و از پروژه مشابهی که از هدفون بی‌سیم و مدل‌های قبلی متکی به دوربین استفاده می‌کرد، توسعه داده شده است.
این عینک به گونه‌ای طراحی شده است که ساده باشد و کاربر را با یک دوربین بزرگ یا استفاده از هدفون مواجه نکند.
در عوض، این عینک از سونار(Sonar) به معنی ناوبری و فاصله‌یابی صوتی برای حس کردن حرکات گلو استفاده می‌کند و در عین حال از الگوریتم یادگیری عمیق برای تجزیه و تحلیل پژواک‌ها در لحظه استفاده می‌کند. این کار به سیستم اجازه می‌دهد تا به دقت ۹۵ درصدی در تشخیص کلماتی که بی‌صدا توسط کاربر تلفظ می‌شوند، دست یابد.
سونار یا ناوبری و فاصله‌یابی صوتی در اصل به یک دستگاه ردیاب زیردریایی گفته می‌شود که طرز کار آن استفاده از انتشار امواج صوتی است و علاوه بر ردیابی، معمولاً به منظور ناوبری و ارتباط با دیگر یگان‌های شناور و زیرآبی نیز استفاده می‌شود.
خفاش‌ها به منظور حرکت کردن و تعیین مسیر و شکار حشرات در تاریکی مطلق، یک سامانه با قدمت بیش از ۶۰ میلیون ساله دارند که بر هر سامانه ناوبری که تاکنون به وسیله فناوری تولید شده برتری دارد. آنها با فریاد زدن در فرکانس‌های فراصوت(معمولاً بالای ۲۰ کیلوهرتز) می‌توانند صداهای منعکس‌شده از اشیاء اطرافشان را تشخیص دهند و آنها را به صورت یک «تصویر صوتی» تفسیر کنند. این بسیار موضوع پیچیده‌ای است که آنها می‌توانند در سرعت‌های بالا پرواز کنند و در مسیرشان از همه موانع اجتناب کنند و حتی حشرات کوچک را از فاصله چند متری تشخیص دهند.
بانگ‌ها و صداهای مافوق صوتی که در حنجره خفاش‌ها تولید می‌شود، برای شناسایی محیط اطرافشان و همچنین برای پیدا کردن غذا کارآمد و دقیق است.
دو بلندگوی مینیاتوری در قسمت زیرین قاب عینک و زیر یک لنز نصب شده‌اند، در حالی که دو میکروفون کوچک در زیر لنز دیگر قرار گرفته‌اند. این بلندگوها امواج صوتی غیر قابل شنیدن را منتشر می‌کنند که از دهان کاربر منعکس می‌شود و به سمت میکروفون برمی‌گردد.
این پژواک‌ها در لحظه توسط یک الگوریتم یادگیری عمیق در تلفن هوشمند متصل به صورت بی‌سیم تجزیه و تحلیل می‌شوند. این الگوریتم برای مرتبط ساختن پژواک‌های خاص با حرکات خاص دهان آموزش داده می‌شود.
این فناوری به گونه‌ای طراحی شده است که نُقلی، کم مصرف و حساس به حریم خصوصی باشد و هیچ داده‌ای از تلفن کاربر خارج نشود. به این ترتیب، هیچ نگرانی در مورد حریم خصوصی وجود نخواهد داشت.
این عینک همچنین دارای حالتی است که نیاز به رو به رو شدن با دوربین یا قرار دادن چیزی در گوش کاربر را برطرف می‌کند. بنابراین نسبت به سایر فناوری‌های تشخیص گفتار بی‌صدا عملی‌تر و دردسترس‌تر است.
به گفته چنگ ژانگ استادیار علوم اطلاعات درد انشگاه کرنل، بیشتر فناوری‌ها در تشخیص بی‌صدای گفتار به مجموعه‌ای از دستورات از پیش تعیین شده محدود می‌شود و کاربر را ملزم می‌کند با دوربین روبرو شود یا آن را بپوشد که نه عملی است و نه امکانپذیر. ما در حال تحقق سونار روی بدن هستیم.پژوهشگران می‌گویند، این سیستم تنها به چند دقیقه داده آموزشی برای یادگیری الگوهای گفتار کاربر نیاز دارد و پس از آماده شدن برای کار، امواج صوتی را در سراسر صورت کاربر ارسال و دریافت می‌کند و حرکات دهان را حس می‌کند و در عین حال از الگوریتم یادگیری عمیق برای تجزیه و تحلیل پژواک‌ها استفاده می‌کند.عینک EchoSpeech در حال حاضر قادر است ۳۱ دستور را با دقت ۹۵ درصدی تشخیص دهد.نسخه فعلی این عینک از آنجایی که از یک دوربین پرقدرت استفاده نمی‌کند، حدود ۱۰ ساعت عمر باتری ارائه می‌دهد و پردازش داده‌ها را به صورت بی‌سیم در تلفن هوشمند کاربر انجام می‌دهد تا همین‌طور کوچک و بدون مزاحمت باقی بماند. این در حالی است که سازندگان آن ادعا می‌کنند که سیستم‌های مبتنی بر دوربین با هر بار شارژ تنها برای حدود ۳۰ دقیقه کار می‌کنند.

دیدگاهتان را بنویسید لغو پاسخ

ادامه

بایدها و نبایدهای سرمایه‌گذاری در بخش کشاورزی

بزرگ‌ترین نیروگاه‌های خورشیدی جهان در سال ۲۰۲۵

قیمت خودرو هنوز به نرخ ارز نرسیده است

اخرین اخبار

بایدها و نبایدهای سرمایه‌گذاری در بخش کشاورزی

بزرگ‌ترین نیروگاه‌های خورشیدی جهان در سال ۲۰۲۵

چگونه بفهمیم که فرزندمان دچار اختلال اضطرابی است؟

قیمت خودرو هنوز به نرخ ارز نرسیده است

پایگاه خبری هیچ یک

مجله فرهنگ -هنر و سبک زندگی