تصور کنید در یک تماس ویدیویی رسمی با همکاری در اسپانیا هستید. شما به انگلیسی صحبت میکنید و او فقط اسپانیایی بلد است. پیش از این، یا باید مترجم انسانی در میانهٔ تماس حضور میداشت، یا میخواستید از زیرنویسهای نهچندان دقیق استفاده کنید. اما حالا با ویژگی جدیدی از Google Meet، صدای شما همان لحظه با لحن، بیان و حس شما به زبان همکار شما دوبله میشود. این تکنولوژی جدید از مدل هوش مصنوعی Gemini بهره میبرد و نهتنها ترجمه میکند، بلکه صدای شما را نیز تقلید میکند. بهعبارت دیگر، صدای شما، زبان او. این قابلیت در آستانهٔ تعریف دوبارهای برای تعاملات بینالمللی قرار دارد و کلمهٔ کلیدی «ترجمه همزمان گفتاری با هوش مصنوعی» دیگر تنها یک رؤیا نیست.
آغاز ارائهٔ ترجمهٔ همزمان در Google Meet
در کنفرانس Google I/O امسال، یکی از جذابترین ویژگیهای معرفیشده، قابلیت ترجمهٔ همزمان گفتار در پلتفرم تماس ویدیویی Google Meet بود. این ویژگی، با تکیه بر هوش مصنوعی Gemini، به کاربران امکان میدهد تا آنچه میگویند را همان لحظه به زبان مخاطبشان ترجمه کنند. اما تفاوت اصلی این قابلیت با زیرنویسگذاریهای قدیمی یا ترجمههای ماشینی، در سطح «بازآفرینی» صدای گوینده است.
بهبیان دقیقتر، آنچه مخاطب میشنود نه تنها ترجمهٔ دقیق گفتههاست، بلکه همان بیان، تُن صدا و لحن احساسی نیز حفظ میشود. در نسخهٔ نمایشی که گوگل به نمایش گذاشت، فردی انگلیسیزبان با همکاری اسپانیاییزبان وارد مکالمه میشود. با فعالسازی گزینهٔ ترجمهٔ گفتاری، Meet صحبتها را با صدای بازتولیدشدهٔ گوینده، اما به زبان مقابل، دوبله میکند.
ترجمهای فراتر از واژهها: بازتولید کامل تجربهٔ گفتاری
آنچه Google ارائه داده، فقط تبدیل زبان نیست؛ بلکه تلاش برای حفظ اصالت تجربهٔ شنیداری است. مدل Gemini از صوت ورودی نهتنها متن را استخراج میکند، بلکه ویژگیهای آوایی مانند زیر و بمی صدا، شتاب ادای کلمات و حتی مکثهای گفتاری را تحلیل میکند. سپس با استفاده از صداساز (voice synthesis engine) مبتنی بر همان ویژگیها، جملهٔ ترجمهشده را با لحن گوینده بازتولید میکند.
این رویکرد، تجربهای بسیار طبیعیتر از ترجمههای سنتی فراهم میآورد و برای ارتباطات احساسی، جلسات مهم تجاری یا حتی تدریس در کلاسهای چندزبانه، تحولی بنیادین محسوب میشود.
برنامهٔ عرضه و اشتراکهای ویژه
در حال حاضر، این قابلیت تنها در مرحلهٔ بتا و برای کاربران اشتراکهای ویژه در دسترس است. کاربران طرح AI Pro و همچنین مشترکین پلن جدید AI Ultra میتوانند از آن استفاده کنند. اشتراک AI Ultra که در کنفرانس امسال معرفی شد، ماهانه ۲۴۹.۹۹ دلار قیمت دارد. گرچه این قیمت نسبتاً بالا بهنظر میرسد، اما برای کسبوکارهای بزرگ یا سازمانهای چندزبانه، میتواند گزینهای بسیار مقرونبهصرفه باشد.
این قابلیت فعلاً فقط برای ترجمه میان زبانهای انگلیسی و اسپانیایی فعال است، اما گوگل اعلام کرده است که بهزودی زبانهای ایتالیایی، آلمانی و پرتغالی نیز به این فهرست افزوده خواهند شد.
رقابت با Microsoft Teams و آیندهٔ تماسهای چندزبانه
جالب است که رقیب اصلی Google در این حوزه نیز دستروی همین موضوع گذاشته است. Microsoft Teams نیز پیشنمایشی از ویژگی مشابهی ارائه کرده که ترجمهٔ صوتی با کمک هوش مصنوعی را ممکن میسازد. با این حال، آنچه Google ارائه کرده در سطحی دقیقتر و با تمرکز ویژه بر بازسازی صوتی (speech cloning) عمل میکند، که مزیتی بیبدیل در جذب کاربران حرفهای خواهد بود.
در یک نگاه کلی
در یک نگاه کلی، Google Meet با افزودن قابلیت ترجمه همزمان گفتاری بهصورت بازتولیدشده و انسانی، قدم بزرگی در جهت حذف مرزهای زبانی در ارتباطات جهانی برداشته است. این قابلیت نهتنها مفهوم ترجمه را به سطح جدیدی ارتقا داده، بلکه کیفیت تماسهای بینالمللی را نیز بهطور محسوسی بهبود میبخشد. در آیندهای نزدیک، تماس تصویری بدون مترجم، آنهم با دقت آوایی، دیگر عجیب نخواهد بود. این گام بهوضوح مسیر آیندهٔ جلسات دیجیتال را نشان میدهد.
آیا مترجمها شغل خود را از دست خواهند داد؟
با رشد سریع قابلیتهای بازآفرینی صدای هوش مصنوعی و ترجمهٔ بلادرنگ، ممکن است در آینده نهچندان دور، نقش انسانها در ترجمههای شفاهی بهچالش کشیده شود. اما آیا فناوری میتواند همیشه ظرافتهای انسانی را درک کند؟
سؤالات رایج (FAQ)
۱. آیا ترجمهٔ صوتی Google Meet در حال حاضر برای همه در دسترس است؟
خیر، این قابلیت فقط برای کاربران پلن AI Pro و AI Ultra فعال شده و هنوز در مرحلهٔ بتا قرار دارد.
۲. آیا این قابلیت صدای واقعی گوینده را بازتولید میکند؟
بله، مدل هوش مصنوعی تلاش میکند تا ویژگیهای صوتی گوینده مانند تُن، آهنگ و بیان را حفظ کند و با صدایی شبیه به گوینده، ترجمه را ارائه دهد.
۳. چه زبانهایی در حال حاضر پشتیبانی میشوند؟
در حال حاضر فقط انگلیسی و اسپانیایی پشتیبانی میشوند، اما گوگل قول داده بهزودی زبانهای آلمانی، ایتالیایی و پرتغالی را نیز اضافه کند.
۴. آیا Microsoft Teams هم چنین قابلیتی دارد؟
بله، Microsoft Teams نیز ویژگی ترجمهٔ گفتاری را بهصورت پیشنمایش ارائه داده، اما هنوز در مرحلهٔ توسعه است و در برخی زمینهها از Google Meet عقبتر است.
۵. کاربرد اصلی این فناوری در چه موقعیتهایی است؟
جلسات تجاری بینالمللی، آموزش چندزبانه، مشاورههای آنلاین و هر موقعیتی که نیاز به درک دقیق مفاهیم گفتاری میان افراد با زبانهای متفاوت باشد.
منبع
source