هوش مصنوعی Stable Diffusion چیست؟ (ساخت تصویر با Stable Diffusion)

مدیریت ۲۶ آذر ۱۴۰۳آخرین بروزرسانی: ۱۱ بهمن ۱۴۰۳

۰ ۷,۷۰۵ زمان تقریبی مطالعه ۶ دقیقه

هوش مصنوعی Stable Diffusion یکی از پیشرفته‌ ترین ابزار های تبدیل متن به تصویر است که با قابلیت‌ ها و عملکرد قوی، جایگاه ویژه‌ ای در میان کاربران پیدا کرده است. در این مطلب، به بررسی ویژگی‌ ها، مزایا و نحوه استفاده از این ابزار محبوب می‌پردازیم.

لینک های مفید:

هوش مصنوعی Stable Diffusion چیست؟

در گذشته، دسترسی به ابزار های تبدیل متن به تصویر اغلب محدود بود و کاربران برای عضویت به دعوت‌ نامه نیاز داشتند. هرچند این روند در ماه‌ های اخیر تغییر کرده و ابزار های بیشتری در دسترس عموم قرار گرفته‌ اند، اما بسیاری از این سرویس‌ ها تنها مقدار محدودی اعتبار رایگان ارائه می‌ دهند و برای ادامه استفاده، نیازمند پرداخت هزینه هستند.

Stable Diffusion که توسط مؤسسه Stability AI توسعه یافته، با رویکردی متفاوت وارد عرصه شده است. این هوش مصنوعی کد منبع باز (Open Source) خود را به‌ صورت عمومی منتشر کرده و بدین‌ ترتیب، به ابزاری جذاب برای طرفداران نرم‌ افزار های آزاد و متن‌ باز تبدیل شده است.

همچنین بخوانید: آموزش تولید محتوا با استفاده از هوش مصنوعی

ویژگی‌ های برجسته Stable Diffusion

کد منبع باز و دسترسی گسترده
برخلاف بسیاری از ابزارهای مشابه مانند DALL-E 2، Stable Diffusion با انتشار کد منبع خود، امکان اجرا روی دستگاه‌ های مختلف را فراهم کرده است. این ویژگی به کاربران اجازه می‌ دهد تا بدون محدودیت، از این ابزار در پروژه‌ های شخصی یا حرفه‌ ای استفاده کنند.
قابلیت اجرا روی دستگاه‌های شخصی
Stable Diffusion را می‌ توان روی کامپیوتر های خانگی و لپ‌ تاپ‌ ها نصب و اجرا کرد. البته برای تجربه بهترین عملکرد، به سخت‌ افزار قدرتمند یا کارت گرافیک مجزا نیاز خواهید داشت. با این حال، کاربران می‌ توانند از نسخه‌ های تحت وب یا افزونه‌ های مرتبط مانند افزونه فتوشاپ نیز بهره ببرند.
قوانین آزادانه‌تر در تولید تصاویر
یکی از مزایای Stable Diffusion نسبت به رقبا، پشتیبانی از تولید چهره و آزادی بیشتر در خلق تصاویر است. این ویژگی آن را به ابزاری مناسب برای پروژه‌ های خلاقانه و متنوع تبدیل کرده است.
گزینه‌های اقتصادی برای کاربران
اگرچه استفاده از Stable Diffusion روی دستگاه‌ های شخصی رایگان است، اما سرویس‌ های تحت وب آن مانند Dream Studio نیازمند پرداخت هزینه هستند. با این حال، هنگام ثبت‌ نام در این پلتفرم، ۲۰۰ واحد اعتبار رایگان به کاربران تعلق می‌ گیرد که برای آشنایی اولیه و آزمایش قابلیت‌ ها کافی است.

نحوه استفاده از هوش مصنوعی Dream Studio برای ساخت تصویر

همان‌طور که پیش‌تر اشاره شد، روش‌های متعددی برای بهره‌مندی از قابلیت‌های هوش مصنوعی Stable Diffusion وجود دارد. یکی از ساده‌ترین و محبوب‌ترین این روش‌ها، استفاده از سرویس تحت وب Dream Studio است. اگرچه نصب این هوش مصنوعی روی کامپیوتر نیز امکان‌پذیر است، اما به‌دلیل پیچیدگی‌های فنی و نیاز به سخت‌افزار قدرتمند، در اینجا تنها به روش استفاده از گزینه تحت وب می‌پردازیم.

مراحل استفاده از سایت Dream Studio

مراجعه به وب‌ سایت Dream Studio
ابتدا به آدرس Beta.DreamStudio.ai مراجعه کنید. در این صفحه، باید یک حساب کاربری ایجاد کنید. می‌توانید با استفاده از ایمیل خود ثبت‌ نام کنید یا از حساب کاربری گوگل یا دیسکورد برای ورود استفاده نمایید.

وب‌ سایت Dream Studio

ثبت‌نام و ورود به حساب کاربری
پس از ثبت‌نام و ورود، به صفحه اصلی Dream Studio هدایت می‌شوید. در این صفحه، امکانات مختلفی برای ساخت تصاویر بر اساس متن در اختیار شما قرار می‌گیرد.

ساخت اکانت در سایت Dream Studio

آغاز فرایند تولید تصویر
مهم‌ترین بخش Dream Studio، کادر متنی قرار گرفته در پایین صفحه است که در کنار دکمه‌ی Dream قرار دارد. در این قسمت، توضیحات و جزئیات مربوط به تصویر موردنظر خود را وارد کنید. برای مثال، می‌توانید موضوع تصویر، سبک هنری و جزئیات دیگر را در قالب متن وارد نمایید.
ایجاد تصویر با یک کلیک
پس از تکمیل توضیحات، روی دکمه‌ی Dream کلیک کنید. سیستم هوش مصنوعی بر اساس ورودی شما تصویر را تولید کرده و به نمایش می‌گذارد.

تولید تصویر در Dream Studio

به طور خلاصه، برای تبدیل متن به تصویر کافی است جزئیات موردنظر خود را در کادر متنی پایین صفحه وارد کرده و سپس روی دکمه Dream کلیک کنید.
توجه داشته باشید که هرچه توضیحات شما دقیق‌تر و واضح‌تر باشند، نتیجه بهتری حاصل می‌شود. با این حال، بهتر است از دستورات خیلی طولانی پرهیز کنید؛ زیرا بسیاری از هوش‌ های مصنوعی ممکن است با متن‌ های طولانی دچار مشکل شوند.

10 9

برای آشنایی بیشتر با دستورات و مشاهده آثار تولید شده توسط هوش مصنوعی، می‌ توانید از وب‌ سایت Lexica.art استفاده کنید. این سایت مجموعه‌ ای از تصاویر تولید شده همراه با دستورات استفاده‌ شده را ارائه می‌ دهد و منبعی عالی برای یادگیری و الهام‌ گیری است.

اگر یکی از دستورات سایت Lexica را در Dream Studio وارد کنید، مشاهده خواهید کرد که خروجی ایجادشده با نمونه اصلی تفاوت‌هایی دارد و معمولاً چندین تصویر متنوع به شما ارائه می‌شود. برای تولید تصویری که به یک عکس خاص شباهت بیشتری داشته باشد، می‌توانید از قابلیت Seed استفاده کنید.

در صورتی که دستوری طولانی در کادر وارد کرده‌اید اما می‌خواهید تصویر نهایی بیشتر بر یک سوژه خاص تمرکز داشته باشد، می‌توانید کلمه یا عبارت موردنظر را درون پرانتز قرار دهید. همان‌طور که در تصویر زیر نشان داده شده است، این کار باعث می‌شود هوش مصنوعی اهمیت بیشتری به آن کلمه داده و تصویر ساخته‌شده حول آن سوژه شکل بگیرد.

11 8

در پنل سمت راست Dream Studio، گزینه‌های متعددی برای تنظیمات وجود دارد که یکی از آن‌ها Model نام دارد. این بخش به شما امکان می‌دهد تا نسخه‌های مختلف هوش مصنوعی Stable Diffusion یا Stable Inpainting را برای تولید خروجی انتخاب کنید.

در زمان نگارش این مقاله، جدیدترین نسخه Stable Diffusion، ورژن 2.1 است. برای اطلاع از تفاوت‌های بین نسخه‌های مختلف، می‌توانید به وب‌سایت رسمی توسعه‌دهنده مراجعه کنید.

یکی دیگر از گزینه‌های مهم در پنل سمت راست، Steps است که نشان‌دهنده تعداد مراحل پردازش برای تولید تصویر است. این مقدار بین ۱۰ تا ۱۵۰ قابل تنظیم است و با افزایش آن، میزان اعتبار مصرف‌شده از حساب کاربری شما نیز بیشتر می‌شود.

نکته قابل‌توجه این است که افزایش تعداد مراحل معمولاً به بهبود جزئیات تصویر کمک می‌کند، اما برای برخی از خروجی‌ها، مانند تصاویر انتزاعی، استفاده از مقادیر بالا همیشه به معنای کیفیت بهتر نیست و ممکن است نتیجه مشابه یا حتی نامطلوبی حاصل شود.

12 7

هر بار که روی گزینه Dream کلیک می‌کنید، خروجی‌های متفاوتی دریافت خواهید کرد. اگر یکی از خروجی‌ها توجه شما را جلب کرد و قصد دارید آن را بهبود دهید، کافی است نشانگر موس را روی تصویر موردنظر ببرید و سپس روی عددی که در زیر آن نمایش داده شده، کلیک کنید.

عدد Seed برای هر خروجی منحصربه‌فرد است و با وارد کردن آن در پنل سمت راست، می‌توانید تصاویر جدیدی را بر اساس همان خروجی قبلی ایجاد کرده و تغییرات دلخواه خود را اعمال کنید.

13 3

در پنل سمت راست، دو گزینه اول با عناوین Width و Height قرار دارند که به ترتیب عرض و ارتفاع تصویر خروجی را تعیین می‌کنند. کاربران می‌توانند این مقادیر را در بازه‌ای بین ۵۱۲ تا ۱۰۲۴ پیکسل تنظیم کنند.

توجه داشته باشید که هرچه ابعاد تصویر بزرگ‌تر باشد، اعتبار بیشتری برای تولید آن از حساب کاربری شما کسر می‌شود. تصاویر با رزولوشن بالاتر معمولاً کیفیت و جزئیات بهتری دارند. با این حال، مقدار پیش‌فرض برای هر دو گزینه ۵۱۲ پیکسل است.

14 3

یکی از قابلیت‌های جذاب هوش مصنوعی Stable Diffusion، ویژگی CFG Scale است که میزان دقت هوش مصنوعی در پیروی از دستورات کاربر هنگام تولید تصویر را تعیین می‌کند.

این مقدار در بازه‌ای بین ۰ تا ۲۰ قابل تنظیم است. هرچه عدد انتخابی بالاتر باشد، هوش مصنوعی با دقت بیشتری دستورات واردشده را دنبال خواهد کرد و تصاویر خروجی بیشتر مطابق خواسته کاربر خواهند بود.

15 1

یکی دیگر از قابلیت‌های برجسته هوش مصنوعی Stable Diffusion ویژگی img2img است که امکان ایجاد یک تصویر جدید براساس یک تصویر اولیه را فراهم می‌کند.

برای استفاده از این قابلیت، مراحل زیر را دنبال کنید:

در پنل سمت راست، روی کادر None در زیر عنوان Image کلیک کنید.
گزینه Upload Image را انتخاب کرده و تصویر موردنظر خود را بارگذاری نمایید.
پس از انتخاب تصویر و واردکردن دستور، کلید Dream را فشار دهید. خواهید دید که خروجی تولیدشده شباهت زیادی به تصویر ورودی خواهد داشت.

هنگام استفاده از این قابلیت، گزینه‌ای جدید با عنوان Image Strength نمایش داده می‌شود. این گزینه درصد شباهت میان تصویر ورودی و خروجی را تعیین می‌کند؛ هرچه مقدار آن بیشتر باشد، تصویر خروجی با تصویر اولیه شباهت بیشتری خواهد داشت.

16 1

نتیجه‌گیری

هوش مصنوعی Stable Diffusion یکی از پیشرفته‌ترین ابزارهای تبدیل متن به تصویر است که به دلیل متن‌باز بودن، انعطاف‌پذیری بالا و امکانات متنوع، جایگاه ویژه‌ای در میان علاقه‌مندان به هوش مصنوعی و تولید محتوا پیدا کرده است. این ابزار با قابلیت‌هایی همچون ویرایش دقیق تصاویر، تولید آثار هنری خلاقانه، و امکان شخصی‌سازی خروجی‌ها، به کاربران در سطوح مختلف تجربه کمک می‌کند تا به‌راحتی تصاویر دلخواه خود را بسازند.

از ویژگی‌های منحصربه‌فرد این فناوری می‌توان به توانایی تنظیم جزئیات تصویر، کنترل میزان شباهت به ورودی‌ها، و گزینه‌هایی همچون img2img و CFG Scale اشاره کرد که خلاقیت کاربر را به سطح بالاتری می‌برد.

در نهایت، Stable Diffusion یک انتخاب ایده‌ آل برای هنرمندان دیجیتال، طراحان گرافیک، و حتی کاربران عادی است که می‌خواهند بدون نیاز به مهارت‌ های پیچیده، تصاویر حرفه‌ ای خلق کنند. با وجود امکانات گسترده و دسترسی آسان به نسخه‌های وب و نرم‌افزاری، این ابزار می‌تواند به یکی از بهترین گزینه‌ها برای ساخت تصاویر هوشمندانه و شخصی‌ سازی‌ شده تبدیل شود.