پیشرفت ۳ هوش مصنوعی بزرگ در تولید تصاویر
به گزارش سایت توژال. هر شرکت نشان می دهد که فناوری به سرعت و در جهت های مختلف در حال توسعه است و هر شرکت نشان می دهد که پیشرفت ها تا کجا پیش رفته است.
به گزارش DigitalTrends، بیایید با Midjourney شروع کنیم، که بی سر و صدا یک ویرایشگر وب جدید را اواخر پنجشنبه منتشر کرد که تعدادی از ابزارهای مفید پردازش تصویر را در یک رابط کاربری جمع می کند.
پیش از این، عملکردهایی مانند قاب بندی مجدد، رنگ آمیزی مجدد، گسترش مرزهای تصویر، ایجاد محتوای پر و بزرگنمایی نیاز به ابزارهای خاص خود داشتند و در چندین فهرست قرار داشتند، که به سازندگان نیاز داشت که دائماً بین این فهرست ها جابجا شوند فرآیند
به گفته دیوید هولز، مدیر عامل Midgerni در Discord، ویرایشگر وب جدید به گونه ای طراحی شده است که ویرایش تصاویر تولید شده توسط هوش مصنوعی را آسان تر و بدون دردسر کند. او نوشت: «ما معتقدیم که این کار ویرایش عکس را بسیار آسانتر از قبل میکند و نشاندهنده یک قدم بزرگ به جلو است.
این شرکت همچنین ابزار انتخاب جدیدی را معرفی کرد که مانند یک برس دیجیتال عمل می کند و جایگزین ابزارهای انتخاب مربعی و بیضی می شود.
ویرایشگر جدید برای تمامی کاربران Midgerni که قبلا بیش از 10 تصویر بر روی پلتفرم تولید کرده اند در دسترس است. بازخورد اولیه از جامعه تا حد زیادی مثبت بوده است.
این ویرایشگر دو هفته پس از انتشار Midgerni 6.1 ارائه می شود که به طور قابل توجهی کیفیت و ثبات تصویر مانند تعداد صحیح انگشتان و همچنین زمان پردازش و دقت متن درک شده را بهبود بخشید.
Grok-2 هیولا را آزاد می کند
بهروزرسانی Midjourney تنها دو روز پس از راهاندازی استارتآپ xAI ایلان ماسک، Grok-2، اتفاق بزرگ بعدی، در این هفته منتشر شد.
قابلیت های ساخت تصویر Grok به دلیل کیفیت تصویر عالی و سهولت استفاده رایگان، به سرعت در حال افزایش محبوبیت است.
بزرگترین بحث در مورد Grok-2 فقط کیفیت آن نیست، بلکه دستورالعمل های به ظاهر غیر اختصاصی آن است. برخلاف بسیاری از تولیدکنندگان تصویر هوش مصنوعی، به نظر میرسد Grok-2 در مورد دستورالعملهای مربوط به مالکیت معنوی، خشونت و سایر محتواها حرفی برای گفتن ندارد.
مردم قبلاً محدودیتهای آن را آزمایش کردهاند و انواع عکسهای ترسناک و عجیب را ایجاد کردهاند که روزهای اولیه تولید تصویر هوش مصنوعی را تداعی میکنند. اما اگر سخنان ماسک را در نظر بگیریم، فقدان دستورالعمل های Grok-2 هدفمند به نظر می رسد و در نهایت می تواند نحوه توسعه فناوری در آینده را شکل دهد.
گوگل با Imagen 3 وارد رقابت شد
سرانجام گوگل مدل جدید هوش مصنوعی خود، Imagen 3 را معرفی کرد که در روز پنجشنبه برای تمامی کاربران در ایالات متحده عرضه شد. گوگل آن را «مدل متن به تصویر با کیفیت بالا» مینامد که اکنون میتواند «جزئیات بهتر، نور غنیتر و مصنوعات کمتری نسبت به مدلهای قبلی» تولید کند. گوگل همچنین می گوید که Imagen 3 در نمایش متن بهتر است و اکنون در نسخه های مختلف عرضه می شود.
khabarfarsi به نقل از توژال