گوگل ابزار هوش مصنوعی جدیدی به نام Whisk معرفی کرده است که به کاربران این امکان را میدهد تا بهجای وارد کردن متن، عکسهای مختلف را بارگذاری کرده و تصویری خلاقانه و ترکیبی دریافت کنند. این ابزار بهطور ویژه برای الهامگیری سریع طراحی شده و بهجای تمرکز بر ویرایش دقیق، کاربران را به کشف و خلاقیت بصری تشویق میکند.
Whisk؛ دریچهای به خلاقیت بدون محدودیت
ابزار Whisk به کاربران اجازه میدهد تصاویر مختلفی را با موضوعات، صحنهها و سبکهای متفاوت انتخاب کرده و آنها را در یک تصویر جدید و جذاب ترکیب کنند. یکی از ویژگیهای برجسته این ابزار، انعطافپذیری در ایجاد خروجیهای مختلف است. کاربران میتوانند به کمک Whisk، تصاویری خلاقانه از انواع مفاهیم مانند اسباببازیهای نرم (Plushie)، پینهای مینایی (Enamel Pins) یا استیکرها تولید کنند. اگرچه امکان اضافهکردن متن برای شخصیسازی بیشتر وجود دارد، این گزینه اجباری نیست. حتی بدون متن نیز، Whisk قادر است تصاویر ترکیبی منحصربهفردی تولید کند.
چگونه Whisk کار میکند؟
Whisk بر پایه دو فناوری قدرتمند گوگل توسعه یافته است: مدل هوش مصنوعی Gemini و Imagen 3. Gemini، که دسامبر 2023 معرفی شد، قدرت تحلیلی بالایی برای تولید توضیحات مختصر از تصاویر ارائهشده دارد. سپس این توضیحات به Imagen 3 داده میشود، مدلی که با دقت و خلاقیت، تصویری جدید تولید میکند.
یکی از جذابترین ویژگیهای Whisk این است که بیشتر بر «ماهیت» تصاویر تمرکز دارد تا یک بازسازی دقیق. به این معنا که ممکن است خروجی نهایی تفاوتهایی مانند تغییر در قد، رنگ پوست یا مدل مو داشته باشد. این ویژگی به کاربران اجازه میدهد تصاویر خود را در سبکها و قالبهای متفاوت بازآفرینی کنند.
چالشی برای رقبا؛ رقابت بزرگ در دنیای هوش مصنوعی
ابزار Whisk تنها یکی از محصولات جدید گوگل برای تقویت جایگاهش در رقابت بزرگ هوش مصنوعی است. شرکتهای دیگری نظیر OpenAI نیز در حال توسعه ابزارهای مشابه هستند. بهعنوان مثال، OpenAI اخیراً ابزار تولید ویدیو با متن به نام Sora را معرفی کرده است که این رقابت را در زمینه محصولات مصرفی هوش مصنوعی بیشتر کرده است.
یکی از مدیران گوگل این ابزار را راهی برای ایجاد «تجربههای سریع بصری» میداند، نه یک ویرایشگر دقیق. Whisk برای کاربران معمولی طراحی شده تا در زمان کوتاه، ایدهها و خلاقیتهای خود را در قالب تصاویر خلاقانه به نمایش بگذارند.
مراحل اولیه توسعه و دسترسپذیری
Whisk هنوز در مراحل اولیه توسعه قرار دارد و فعلاً تنها از طریق وبسایت Google Labs در دسترس کاربران آمریکایی است. این ابزار بیشتر بهعنوان یک سرگرمی خلاقانه و ابزاری برای الهامبخشی طراحی شده است و گوگل برنامه دارد با دریافت بازخورد کاربران، قابلیتهای آن را در آینده گسترش دهد.
قدرت DeepMind پشت Whisk
توسعه Whisk بر اساس فناوریهای پیشرفته آزمایشگاه هوش مصنوعی DeepMind، که گوگل در سال 2014 خریداری کرد، انجام شده است. DeepMind که در زمینه پژوهشهای پیشرفته هوش مصنوعی شهرت دارد، اخیراً به دلیل کشفیات مهم در شیمی پروتئین موفق به دریافت جایزه نوبل شده است. این نشان از قدرت علمی و فنی تیم پشت ابزار Whisk دارد.
آینده ابزارهای هوش مصنوعی در گوگل
گوگل با ابزارهایی مانند Whisk، نشان داده که برای سال 2025 برنامههای بزرگی در زمینه هوش مصنوعی دارد. از جمله این برنامهها میتوان به سیستم عامل اندروید جدیدی که با همکاری سامسونگ و کوالکام طراحی شده اشاره کرد. رقابت در این حوزه تنها به ابزارهای بصری محدود نیست و محصولات جدید در زمینههای مختلف از جمله ویدیو و متن نیز در حال توسعه هستند.
این نوشتهها را هم بخوانید
source