روش جدید محققان MIT سرعت تولید تصویر هوش مصنوعی را تا 30 برابر افزایش می‌دهد

اگرچه در مدت‌ اخیر هوش مصنوعی مولد به چنان پیشرفتی رسیده که می‌تواند تصاویری باورنکردنی بسازد، اما همچنان سرعت آن در تولید این تصاویر پایین است. اکنون محققان MIT و ادوبی برای حل این مسئله، روش بسیار سریعی که تأثیر بسیار کمی بر کیفیت عکس می‌گذارد، ایجاد کرده‌اند. در این روش می‌توان در هر ثانیه حدود 20 تصویر تولید کرد؛ به عبارتی سرعت آن 30 برابر بیشتر از مدل‌های متداول است.

هوش مصنوعی‌های مولد تصویر متداول معمولاً از فرایندی به نام انتشار یا Diffusion استفاده می‌کنند که تصویر نهایی را از طریق چندین مرحله نمونه‌برداری اصلاح می‌کند. حالا محققان MIT و ادوبی برای سرعت‌بخشیدن به این فرایند روشی به نام DMD معرفی کردند. این روش یک مدل انتشار چند مرحله‌ای را به یک فرایند یک مرحله‌ای کاهش می‌دهد. کیفیت تصاویر نهایی این روش را می‌توان با مدل‌هایی مثل Stable Diffusion 1.5 مقایسه کرد.

تولید تصاویر هوش مصنوعی با 30 برابر سرعت بیشتر

محققان ادعا می‌کنند که مدل آن‌ها می‌تواند 20 تصویر در ثانیه تولید کند. آن‌ها در بررسی خود، روش جدید را با روش مدل Stable Diffusion 1.5 مقایسه کرده‌اند. درحالی که مدل SD برای هر تصویر به 1.4 ثانیه نیاز دارد، DMD می‌تواند تصویر مشابهی را در کسری از ثانیه ارائه دهد. بین کیفیت و سرعت تعادل خوبی وجود دارد و نتایج نهایی برای یک کاربر معمولی قابل‌ قبول است.

مقایسه سرعت تولید تصویر در مدل DMD (سمت راست) و مدل Stable Diffusion (سمت چپ)

البته روش DMD اولین روش تک مرحله‌ای نیست که برای تولید تصویر هوش مصنوعی ارائه شده است. شرکت Stability AI نیز روشی به نام ADD برای تولید تصاویر 1 مگاپیکسلی به‌صورت لحظه‌ای توسعه داده است. این شرکت مدل SDXL Turbo خود را از طریق ADD آموزش داد و به سرعت تولید تصویر تنها 207 میلی‌ثانیه روی یک پردازشگر انویدیا A100 دست یافت.

تولید تصاویر هوش مصنوعی با 30 برابر سرعت بیشتر

دیدگاهتان را بنویسید لغو پاسخ