یک سیستم بینایی رایانهای یکپارچه (MAGE) که توسط محققان دانشگاه امآیتی و شرکت گوگل توسعه یافته است، میتواند کار تولید و تشخیص تصاویر را که معمولاً به طور جداگانه انجام میشود، به صورت همزمان انجام دهد.
به گزارش پایگاه خبری هیچ یک _ از «امآیتی نیوز»، رایانهها در رابطه با تصاویر دارای دو قابلیت قابل توجه هستند؛ هم میتوانند آنها را شناسایی و هم دوباره تولید کنند و این دو کارکرد همیشه از هم جدا بودهاند. حال سوالی که مطرح میشود این است که آیا امکان ترکیب و هماهنگی این دو کارکرد متفاوت با یکدیگر وجود دارد؟
محققان آزمایشگاه علوم کامپیوتر و هوش مصنوعی دانشگاه امآیتی، سیستمی را آموزش دادهاند تا قسمتهای گمشده یک تصویر را استنباط کند، کاری که نیاز به درک عمیق محتوای تصویر دارد. با پُرکردن موفقیت آمیز جاهای خالی، این سیستم که به عنوان رمزگذار مولد نقاب دار (MAGE) شناخته میشود، به دو هدف شناسایی دقیق تصاویر و ایجاد تصاویر جدید با شباهت چشمگیر به واقعیت به طور همزمان دست مییابد.
این سیستم دومنظوره کاربردهای بالقوه بیشماری مانند شناسایی و طبقهبندی اشیا در تصاویر، یادگیری سریع از حداقل نمونهها، ایجاد تصاویر تحت شرایط خاص و بهبود تصاویر موجود را امکانپذیر میسازد.
جدا از توانایی این سیستم در تولید تصاویر واقعی از ابتدا، (MAGE) امکان تولید تصاویر مشروط را نیز فراهم میکند. کاربران میتوانند معیارهای خاصی را برای تصاویری که میخواهند این سیستم تولید کند، مشخص کنند و این ابزار تصویر مناسب را تهیه میکند. همچنین این سیستم قادر به ویرایش تصویر یا حذف عناصر از یک تصویر در عین حفظ ظاهر واقعی آن است.
وظیفه تشخیص یکی دیگر از قابلیتهای قدرتمند این سیستم به حساب میآید و تنها با تعداد انگشتشماری از نمونههای برچسبگذاری شده، به نتایج چشمگیری در مجموعه دادههای تصویری بزرگ میرسد.
عملکرد این سیستم زمانی که مورد ارزیابی قرار گرفت، نتایج مثبت چشمگیری داشت. از یک طرف، رکوردهای جدیدی را در تولید تصاویر جدید ثبت کرد و با پیشرفت قابل توجهی از مدل های قبلی پیشی گرفت. از طرف دیگر در زمینه تشخیص، در ۷۰.۱ درصد از موارد تنها با داشتن ۱۰ نمونه برچسبدار و طبقهبندی شده، توانست تصاویر را به درستی شناسایی کند.
بهرغم نقاط قوت موجود، گروه تحقیقاتی این پروژه تایید میکند که این سیستم هنوز جای پیشرفت زیادی دارد. آنها مشتاق هستند راههایی را برای فشرده سازی تصاویر بدون از دست دادن جزئیات مهم و کیفیت در آینده کشف کنند. این تیم همچنین قصد دارد این سیستم (MAGE) را روی مجموعه دادههای بزرگتر آزمایش کند. اکتشافات آینده ممکن است شامل آموزش این سیستم روی مجموعه دادههای مرتب نشده بزرگتر باشد که به طور بالقوه منجر به عملکرد بهتر میشود.
هویی شنگ وانگ (Huisheng Wang) کارمند ارشد بخش مهندسی نرم افزار در بخش تحقیقات و هوش ماشینی گوگل (که در این پروژه دخالتی نداشت) میگوید: دستیابی به تولید تصویر و تشخیص تصویر در یک سیستم واحد، یک رویای قدیمی بوده است. (MAGE) یک تحقیق پیشگامانه است که با موفقیت از هم افزایی این دو کارکرد (تشخیص و تولید تصاویر) استفاده میکند و به پیشرفته ترین آنها در یک سیستم واحد دست مییابد. این سیستم نوآورانه کاربردهای گسترده و پتانسیل الهام بخشیدن به بسیاری از کارهای آینده در زمینه بینایی کامپیوتر را دارد.