گوگل ابزار هوش مصنوعی جدیدی به نام Whisk معرفی کرده است که به کاربران این امکان را می‌دهد تا به‌جای وارد کردن متن، عکس‌های مختلف را بارگذاری کرده و تصویری خلاقانه و ترکیبی دریافت کنند. این ابزار به‌طور ویژه برای الهام‌گیری سریع طراحی شده و به‌جای تمرکز بر ویرایش دقیق، کاربران را به کشف و خلاقیت بصری تشویق می‌کند.

Whisk؛ دریچه‌ای به خلاقیت بدون محدودیت

ابزار Whisk به کاربران اجازه می‌دهد تصاویر مختلفی را با موضوعات، صحنه‌ها و سبک‌های متفاوت انتخاب کرده و آن‌ها را در یک تصویر جدید و جذاب ترکیب کنند. یکی از ویژگی‌های برجسته این ابزار، انعطاف‌پذیری در ایجاد خروجی‌های مختلف است. کاربران می‌توانند به کمک Whisk، تصاویری خلاقانه از انواع مفاهیم مانند اسباب‌بازی‌های نرم (Plushie)، پین‌های مینایی (Enamel Pins) یا استیکرها تولید کنند. اگرچه امکان اضافه‌کردن متن برای شخصی‌سازی بیشتر وجود دارد، این گزینه اجباری نیست. حتی بدون متن نیز، Whisk قادر است تصاویر ترکیبی منحصربه‌فردی تولید کند.

چگونه Whisk کار می‌کند؟

Whisk بر پایه دو فناوری قدرتمند گوگل توسعه یافته است: مدل هوش مصنوعی Gemini و Imagen 3. Gemini، که دسامبر 2023 معرفی شد، قدرت تحلیلی بالایی برای تولید توضیحات مختصر از تصاویر ارائه‌شده دارد. سپس این توضیحات به Imagen 3 داده می‌شود، مدلی که با دقت و خلاقیت، تصویری جدید تولید می‌کند.

یکی از جذاب‌ترین ویژگی‌های Whisk این است که بیشتر بر «ماهیت» تصاویر تمرکز دارد تا یک بازسازی دقیق. به این معنا که ممکن است خروجی نهایی تفاوت‌هایی مانند تغییر در قد، رنگ پوست یا مدل مو داشته باشد. این ویژگی به کاربران اجازه می‌دهد تصاویر خود را در سبک‌ها و قالب‌های متفاوت بازآفرینی کنند.

چالشی برای رقبا؛ رقابت بزرگ در دنیای هوش مصنوعی

ابزار Whisk تنها یکی از محصولات جدید گوگل برای تقویت جایگاهش در رقابت بزرگ هوش مصنوعی است. شرکت‌های دیگری نظیر OpenAI نیز در حال توسعه ابزارهای مشابه هستند. به‌عنوان مثال، OpenAI اخیراً ابزار تولید ویدیو با متن به نام Sora را معرفی کرده است که این رقابت را در زمینه محصولات مصرفی هوش مصنوعی بیشتر کرده است.

یکی از مدیران گوگل این ابزار را راهی برای ایجاد «تجربه‌های سریع بصری» می‌داند، نه یک ویرایشگر دقیق. Whisk برای کاربران معمولی طراحی شده تا در زمان کوتاه، ایده‌ها و خلاقیت‌های خود را در قالب تصاویر خلاقانه به نمایش بگذارند.

مراحل اولیه توسعه و دسترس‌پذیری

Whisk هنوز در مراحل اولیه توسعه قرار دارد و فعلاً تنها از طریق وب‌سایت Google Labs در دسترس کاربران آمریکایی است. این ابزار بیشتر به‌عنوان یک سرگرمی خلاقانه و ابزاری برای الهام‌بخشی طراحی شده است و گوگل برنامه دارد با دریافت بازخورد کاربران، قابلیت‌های آن را در آینده گسترش دهد.

قدرت DeepMind پشت Whisk

توسعه Whisk بر اساس فناوری‌های پیشرفته آزمایشگاه هوش مصنوعی DeepMind، که گوگل در سال 2014 خریداری کرد، انجام شده است. DeepMind که در زمینه پژوهش‌های پیشرفته هوش مصنوعی شهرت دارد، اخیراً به دلیل کشفیات مهم در شیمی پروتئین موفق به دریافت جایزه نوبل شده است. این نشان از قدرت علمی و فنی تیم پشت ابزار Whisk دارد.

آینده ابزارهای هوش مصنوعی در گوگل

گوگل با ابزارهایی مانند Whisk، نشان داده که برای سال 2025 برنامه‌های بزرگی در زمینه هوش مصنوعی دارد. از جمله این برنامه‌ها می‌توان به سیستم عامل اندروید جدیدی که با همکاری سامسونگ و کوالکام طراحی شده اشاره کرد. رقابت در این حوزه تنها به ابزارهای بصری محدود نیست و محصولات جدید در زمینه‌های مختلف از جمله ویدیو و متن نیز در حال توسعه هستند.


  این نوشته‌ها را هم بخوانید

source

توسط salamathyper.ir