DALL-E 3: ابزارهای ویرایش یکپارچه که نیاز به بهبود دارند
آشنایی با DALL-E 3: ویرایش آنلاین تصاویر به سادگی
آیا تا به حال خواستهاید که بلافاصله پس از ایجاد تصویر با DALL-E 3، تغییراتی در آن اعمال کنید اما نمیدانستید چگونه این کار را انجام دهید؟ OpenAI به این نیاز شما پاسخ داده و ابزارهای ویرایش آنلاین را بهDALL -E 3 در ChatGPT افزوده است. با این قابلیت، شما میتوانید بدون خروج از اپلیکیشن، تغییرات دلخواه خود را بر روی آثار خود اعمال کنید. DALL-E 3 به کاربران این امکان را میدهد که با استفاده از متنهای توصیفی، تصاویری خیرهکننده و دقیق ایجاد کنند. این ابزار به طور خاص برای هنرمندان، طراحان و هر کسی که به دنبال تجسم ایدههای خود است، طراحی شده است. یکی از ویژگیهای برجسته این نسخه، قابلیت ویرایش آنلاین است که به شما اجازه میدهد با کلیک بر روی تصویر و توصیف تغییرات مورد نظر، به راحتی ویرایشهای لازم را انجام دهید. این ویژگی به شما کمک میکند تا فرآیند خلاقیت خود را بهبود بخشید و به نتایج مطلوبتری دست یابید.
ابزارهای ویرایش DALL-E 3: قابلیتهای جدید OpenAI
این ویژگیها مدتها در حال توسعه بودند، اما OpenAI بالاخره قابلیت ویرایش را به DALL-E 3 در ChatGPT Plus اضافه کرده است. قبل از این، میتوانستید تلاش کنید تا تغییراتی در آثار DALL-E 3 خود ایجاد کنید، اما معمولاً همیشه منجر به ایجاد تصویر کاملاً جدیدی میشد. حتی اگر پرامپتهای استفاده شده برای ایجاد تصویر ویرایش شده بسیار شبیه به پرامپت اول بودند،
به دلیل ماهیت هوش مصنوعی مولد، خروجی میتوانست به طور قابل توجهی متفاوت باشد. ابزارهای ویرایش DALL-E 3 اکنون به دنبال رفع مشکلات در همان تصویر بدون ایجاد پرامپت جدید هستند. شما یک منطقه در تصویر را که میخواهید تنظیم کنید، برجسته میکنید، از DALL-E درخواست میکنید تا تغییر خاصی را اعمال کند (مانند “این را حذف کن” یا “این ویژگی را اضافه کن”) و آن شروع
به کار میکند.
با این حال، نتایج متفاوت است. مثال وبلاگ رسمی OpenAI نشان میدهد که DALL-E گلهای گیلاس را به تصویر سبک اوکیوو-ای یک گربه اضافه میکند و به طور کامل کار میکند. بر اساس تجربه من، ابزارهای ویرایش DALL-E در اضافه کردن چنین تصاویر با جزئیات به یک تصویر موجود دچار مشکل هستند و به طور کلی قادر به پردازش درخواستهای این چنینی نیستند.
این بدان معنی نیست که ابزارهای ویرایش DALL-E 3 کار نمیکنند. آنها قطعاً میتوانند ویژگیها را حذف کنند و تغییرات کوچک ایجاد کنند، همانطور که در زیر شرح داده شده است، اما همه چیز در مقیاس کوچک است.
آموزش استفاده از ابزار ویرایش DALL-E 3 با مثالهای عملی
بهترین راه برای نشان دادن قابلیتهای ابزار ویرایش DALL-E 3، ارائه چند مثال مناسب است.
حذف و پاک کردن
ابزارهای ویرایش DALL-E 3 میتوانند برخی ویژگیهای کوچک را پاک کنند، اما در این زمینه دچار مشکل هستند. در تصویر زیر، از DALL-E خواستهام “یک دست رباتیک که یک چیپ شفاف و درخشان با نوشته ‘AI Accelerated’ را در دست دارد. پسزمینه تاریک آبی است و فضایی آیندهنگر و با تکنولوژی بالا ایجاد میکند.”
حال، با توجه به اینکه نوشتن متن برای هوش مصنوعی مولد یک مسئله خاص است، تعجبی ندارد که متن اشتباه بود—بنابراین از DALL-E خواستم تا اشتباه املایی را حذف کند. در تلاش اول با پرامپت “لطفاً این را حذف کن” موفق نشد، اما در تلاش دوم با پرامپت “لطفاً این کلمه را از تصویر حذف کن” موفق شد. بنابراین، بله، موفقیت وجود دارد، اما ممکن است نیاز باشد تا پرامپتهای مختلفی را امتحان کنید تا نتیجه مطلوب را بگیرید. سپس از آن خواستم تا حروف AI را به مرکز مربع منتقل کند که در این کار خوب عمل کرد، هرچند به دلیلی کامپیوترم دچار مشکل شد.
در مرحله بعد، از DALL-E خواستم تا به من در ویرایش تصویری از یک تلویزیون که تصویر نویز را نشان میدهد، کمک کند. DALL-E برای تولید تصاویر منحصر به فرد عالی است، اما در برخی جزئیات دچار اشتباه میشود یا متن را به شکل نادرستی ارائه میدهد.
در این مورد، نوار اطلاعات روی صفحه تلویزیون متن نامفهوم AI را نمایش میدهد، بنابراین میخواستم آن را حذف کنم. تلاش اول DALL-E سایهای را در جایی که نوار اطلاعات بود باقی گذاشت، در حالی که تلاشهای دوم و سوم بسیار تمیزتر بودند. نه کاملاً بینقص، اما برای استفادهای که از تصویر میکردم، کافی بود.
اضافه کردن و تغییر دادن
DALL-E 3 میتواند برخی تغییرات را در تصاویر ایجاد کند، اما دوباره، این بستگی به مقیاس آنچه که درخواست میکنید دارد. اضافهکردن و تغییرات کوچک ممکن است، اما بیشتر اوقات، ابزار ویرایش DALL-E نمیتواند آنچه را که خواستهاید پردازش کند.
از DALL-E خواستم “یک تصویر 4K با نسبت 2:1 از یک چشم انسان نزدیک به دوربین و با جزئیات ایجاد کند”، که نتیجه زیر را به همراه داشت:
تصویر نسبتاً خوبی است، اگرچه کمی عجیب به نظر میرسد (بازتاب مژهها؟!)، اما میخواستم رنگ عنبیه را به آبی-سبز تغییر دهم که نتیجه این تصویر بود:
رنگ کمی کدر است اما تغییر نکرده و برخی ویژگیها کمی دچار تغییر شکل شدهاند.
در مرحله بعد، از DALL-E خواستم “یک تصویر 4K با نسبت 2:1 به سبک گلسازی از یک فرد در حال اسکی با لباس ببر در حال پایین آمدن از شیب با پسزمینه یتی ایجاد کند.”
دوباره، تصویر اصلی خوب است، رنگهای تند و زنده دارد و با پرامپت مطابقت دارد. با این حال، میخواستم یتی را به نوع دیگری از حیوان ترسناک تغییر دهم.
به جای تعویض یتی با حیوان دیگری، یتی بهطور کامل ناپدید شد. در عوض، به تصویر اصلی بازگشتم و از آن خواستم تا یک یتی دیگر اضافه کند، که در این کار شکست خورد. همچنین در تلاش برای اضافه کردن درختهای بیشتر به تصویر نیز موفق نشد.
اضافه کردن متن
در اینجا چیز زیادی برای پوشش دادن وجود ندارد. همانطور که گفته شد، هوش مصنوعی مولد بهطور کلی در زمینه متن دچار مشکل است و اضافه کردن متن به یک تصویر حتی دشوارتر است.
از DALL-E خواستم تا یک کارت پستال از یک ساحل بریتانیایی ایجاد کند که این کار را به خوبی انجام داد و صحنه را به زیبایی به تصویر کشید. سپس میخواستم عبارت “Sunny Beach” را به تصویر اضافه کنم، که DALL-E نتوانست از پس آن برآید. تا اینکه پس از حدود شش یا هفت پرامپت رفت و برگشت که به DALL-E یادآوری میکرد چه کاری باید انجام دهد، تصویری کاملاً جدید با متن مورد نیاز ایجاد کرد. و متن نیز دقیق بود؛ در مورد چهره نوزاد در آفتاب مطمئن نیستم.
در مرحله بعد، به سراغ یک کارت تولد رفتم. این بار، DALL-E بدون اینکه از آن خواسته شود “تولدت مبارک” را اضافه کرد، که با توجه به تم، خوب است.
بنابراین از آن خواستم تا تاریخ تولد را روی کارت اضافه کند.
دوباره، نتوانست تاریخ را به کارت اضافه کند، اما پس از چند دور پرامپت، تصویری جدید با تاریخ درخواست شده ایجاد کرد. در این مورد، اضافه کردن تاریخ بهصورت دستی برای من آسانتر بود، بهویژه اگر میخواستم تصویر اصلی را حفظ کنم.
ابزارهای ویرایش DALL-E: مفید اما نیازمند بهبود
من متوجه شدم که ابزارهای ویرایش DALL-E برای برخی از وظایف مفید هستند، اما برای رسیدن به ویرایش صحیح، زمانبر است. در مواقع دیگر، این ابزار به سادگی کار نمیکند و احتمالاً بهتر است که پرامپت اصلی خود را بگیرید و آن را تغییر دهید تا تصویر جدیدی ایجاد کنید.
ابزارهای ویرایش DALL-E احتمالاً با گذر زمان بهبود خواهند یافت، اما تا آن زمان، ممکن است بهتر باشد که تصویر خود را با استفاده از یک ابزار ویرایش تصویر ویرایش کنید تا اینکه بخواهید از طریق چندین دور مکالمه زمانبر با DALL-E این کار را انجام دهید. زمانی که کار میکند، خوب است؛ اما وقتی که متوجه نمیشود یا اصلاً ویرایش را انجام نمیدهد، ناامیدکننده است.
دیدگاهتان را بنویسید