بازگشت «گوگل» به پروژه نافرجام عینک واقعیت افزوده/پروژهای واقعی یا خیالی؟!
به گزارش جهان صنعت نیوز: این مراسم که پس از دو سال از شروع همهگیری دوباره به روی صحنه مانتینویو بازگشته بود، پربارتر و هیجانانگیزتر از سالهای گذشته بود و درکنار خبرهای نرمافزاری و قابلیتهای جدید جستوجو، از Scene Exploration گرفته تا تشخیص هوشمند رنگ پوست، بخش زیادی را به معرفی محصولات سختافزاری و کاربرمحور از جمله پیکسل ۶a، پیکسل واچ و پیکسل تبلت اختصاص داد. اما در پایان مراسم، «گوگل» سورپرایز دیگری را رو کرد که بلندپروازانهترین و به نظرم، آیندهنگرانهترین و هیجانانگیزترین محصول معرفیشده گوگل در این رویداد بود؛ عینک مترجم!
گوگل در ویدئوی کوتاهی، از عینک واقعیت افزوده رونمایی کرد که تنها یک قابلیت دارد و آن نمایش ترجمه صحبتهای افراد درست در گستره دید کاربری است که عینک به چشم دارد. در این ویدئوی احساسی که در پایین آن عبارت «نمایش شبیهسازیشده» درج شده بود، مادر و فرزندی را دیدیم که برای اولین بار توانستند حرف یکدیگر را بفهمند. همچنین فردی را دیدیم که داشت به زبان اشاره صحبت میکرد و ترجمه حرفهایش به زبان انگلیسی برای کسی که عینک گوگل را به چشم داشت، بهصورت واقعیت افزوده و زنده بهنمایش درمیآمد. مدیر محصول «گوگل» قابلیت ترجمه زنده این عینک را «زیرنویسی برای دنیا» توصیف و ما را برای مدت کوتاهی در تصور آیندهای زیباتر از آنچه معمولا انتظارش را داریم، غرق کرد.
اما چقدر این تصور عملی است و چقدر با این آینده فاصله داریم؟ آنقدری که شاید به عمر ما نرسد یا زیر انبوه پروژههای رهاشده گوگل دفن شود؟ همین که گوگل تصمیم گرفته این عینک را تنها به یک قابلیت و آن هم قابلیتی که ۱۶ سال در حال بهبود آن است، مجهز کند، تصمیم بسیار هوشمندانهای بوده و ما را کمی به آینده آن امیدوار میکند.
با اینحال، «گوگل ترنسلیت» اگرچه ابزار بسیار کاربردی و حیرتانگیزی است که در مواقع اضطراری، به کمکمان آمده است، در عین حال به مراتب پیش آمده که اشتباهات خجالتآور زیادی در ترجمه انجام دهد.
شاید در حد احوالپرسی و پرسیدن آدرس بتوان به ترجمه «گوگل ترنسلیت» اعتماد کرد، اما به هیچوجه نمیتوان از درستی ترجمه داستانهای کلاسیک یا ضربالمثلها و جملات پیچیده آن هم از زبانهای غیراروپایی مطمئن بود.
گوگل عینک مترجم را زیرنویسی برای دنیا توصیف میکند
سال ۲۰۱۷ نیز «گوگل» زمانی که داشت برای نسل اول پیکسلبادز تبلیغ میکرد، روی قابلیت ترجمه زنده آن مانور زیادی داد. البته افرادی که تجربه استفاده از این هدفون را داشتند، قابلیت ترجمه زنده آن را ایدهای تحسینبرانگیز اما با پیادهسازی تاسفبار توصیف کردند. ظاهرا توانایی این هدفون در ترجمه مکالمه افراد در حدی بود که احساس میکردید یک کودک پنجساله در حال صحبت با شما است و این تجربه با آنچه گوگل آن زمان در ویدئوی تبلیغاتی پیکسلبادز نمایش داده بود، زمین تا آسمان تفاوت داشت. مشکلات و چالشهای «گوگل» در زمینه ترجمه به کنار، این شرکت وعده داده که ترجمه قرار است داخل عینک واقعیت افزوده صورت گیرد؛ حوزه دیگری که «گوگل» از سال ۲۰۱۲ همچنان با آن درگیر است و هنوز نتوانسته حتی ۱۰ درصد از آنچه را که در ویدئوی مفهومی «گوگل گلس» که آن زمان نشان داده بود، به واقعیت تبدیل کند. در این ویدئو، گوگل وعدههای شگفتانگیز و بلندپروازنهای میدهد؛ تماشا و تعامل با تمام اپلیکیشنهای کاربردی گوشیهای هوشمند مثل یادآوریها، پیامها، ساعت و گزارش آبوهوا، گزارش لحظهای از وضعیت مترو و فلشهای مسیریابی و تماس ویدئویی و ثبت عکس و آپلود آن در شبکههای اجتماعی، همه و همه درست در فضای جلوی چشمان کاربر و بهکمک «گوگل گلس» انجام میشود. اما این پروژه به جایی نرسید و به یک شکست تمامعیار برای گوگل تبدیل شد، بهطوری که تا چند سال سراغی از آن نگرفت.
البته عینک مترجم گوگل از پروژه نافرجام «گلس» متمرکزتر است و فقط قرار است یک کار را انجام دهد که این موضوع، وعده این شرکت بدسابقه را کمی باورپذیرتر میکند. چیزی که گوگل به ما نشان داد عینکی بود که فقط قرار است متن ترجمهشده را نمایش دهد نه اینکه تمام کارهای یک گوشی هوشمند را یکجا برعهده بگیرد، اما انجام همین یک وظیفه چقدر امکانپذیر است، به خصوص در شرایطی که گوگل هنوز هیچ توضیحی درباره سازوکار این عینک ارائه نداده است؟ حقیقت این است که ساخت عینکهای واقعیت افزوده اصلا کار آسانی نیست. اگر در محیطی باشید که میزان نور فقط کمی زیاد باشد، نمیتوانید بهراحتی متنها را بخوانید. حتی خواندن زیرنویس از روی نمایشگر تلویزیون وقتی نور مستقیم خورشید به آن تابیده است، بسیار چالشبرانگیز میشود؛ چه برسد به اینکه بخواهیم این تجربه را روی نمایشگری چسبیده به صورت و آن هم زمانی که مشغول صحبت با کسی هستیم که زبانش را نمیفهمیم، داشته باشیم. البته این را هم باید قبول داشت که تکنولوژی با سرعت در حال پیشرفت است و گوگل ممکن است بتواند تا چند سال دیگر از پس چالشهای کنونی برآید. اما این حقیقت هنوز پا برجاست که «گوگل ترنسلیت» به حدی پیشرفت نکرده تا بتوان با آن ترجمه دقیق و کاملا درستی از مکالمات انجام داد، چطور میتوان انتظار ترجمهای روان را در عینک واقعیت افزوده این شرکت داشت؟
البته همانطور که موقع صحبت کردن با «الکسا»، «سیری» یا «گوگل اسیستنت» از فرمانهای صوتی مشخص و سادهتری استفاده میکنیم تا برای هوش ماشینی قابل فهم باشد، هنگام استفاده از ابزار ترجمه نیز ممکن است از جملات ساده و واضحتری استفاده کنیم. اما در سادهترین حالت هم عملکرد «گوگل ترنسلیت» در حد انتظار نبوده است. مثلا یکی از افراد مسلط به زبان کرهای عنوان کرد که در ویدئوی شمارش معکوس رویداد I/O گوگل، از کلمهای برای «خوش آمدید» استفاده شده بود که هیچ کرهایزبانی از آن استفاده نمیکند. تازه این اشتباه پیشپاافتادهای است؛ زمانی که گوگل داشت با آبوتاب از اضافه شدن ۲۴ زبان جدید به ترنسلیت صحبت میکرد، اشتباه بزرگتر و نابخشودنیتری افتاد! در نمایشگر پشتسر «سوندار پیچای»، مدیرعامل گوگل، نام زبانهایی که با الفبای عربی نوشته شده بودند، بهصورت جدا از هم و برعکس و کاملا نامفهوم تایپ شده بود. حتی یکی از کاربران عربیزبان در توئیتر با منشن کردن «پیچای»، به گوگل طعنه انداخت و گفت: «استارتآپهای کوچک و مستقلی چون گوگل بودجه کافی برای استخدام کسی که سواد نوشتن به زبان عربیاش در حد دانشآموز دبستانی باشد، ندارند.» راستش ما توقع تجربهای صددرصد بیعیب و نقص از محصولات گوگل نداریم، اما برای شرکتی که بهسختی در تلاش است ما را قانع کند چیزی نمانده تا ترجمه زنده را به عینکهای واقعیت افزوده بیاورد، پیش آمدن چنین اشتباهات خجالتآوری، باورپذیری ادعای گوگل را زیر سوال میبرد.واضح است که «گوگل» سعی در حل مشکلی بینهایت پیچیده دارد. ترجمه کلمات، آسان است، فهم گرامر دشوار اما شدنی است؛ اما زبان و مکالمه بسیار پیچیدهتر از کلمات و گرامر هستند. مثلا افرادی که چندزبانه هستند، گاهی هنگام صحبت به یک زبان، از کلمات زبان دیگر استفاده میکنند. فکر میکنید عینک مترجم گوگل بتواند از پس ترجمه این مدل مکالمه برآید؟ تازه داستان زمانی که پای جملات نیمهکاره، دوپهلو، ضربالمثلها و ارجاعات گنگ به میان میآید، پیچیدهتر میشود. البته گوگل در رقابت عینکهای واقعیت افزوده تنها نیست. شرکت «متا» تاکنون میلیاردها دلار برای توسعه عینکهای AR خرج کرده و تعداد کارمندان بخش سختافزار و نرمافزار متاورسی آن بهحدود ۱۸ هزار نفر افزایش یافته که فقط در سال گذشته بیش از ۱۰ میلیارد دلار برای این شرکت هزینه داشته است. نقشه راه «متا» برای عرضه این عینکها که البته از عینک مترجم گوگل بلندپروازانهتر بهنظر میرسند، از سال ۲۰۲۴ تا ۲۰۲۶ تعیین شده، اما بسیار بعید است تا چند سال دیگر شاهد تکنولوژیای باشیم که بتواند فردی را به شکل هولوگرام جلوی ما بنشاند تا با هم شطرنج بازی کنیم.
با تمام این حرفها، برنامه گوگل برای عرضه عینک مترجم کاملا تحسینبرانگیز است و بیصبرانه منتظر روزی هستیم که تمام افراد بتوانند مانند مادر و فرزند ویدئوی گوگل، بدون هیچ مشکلی حرف همدیگر را بفهمند. اما تا رسیدن آن روز و فراگیر شدن استفاده از عینکهای واقعیت افزوده، راه درازی در پیش است و بعید میدانم تلاشهای اولیه گوگل برای عرضه این عینک بهاندازه ویدئویی که در رویداد I/O تماشا کردیم، رضایتبخش باشد.
لینک کوتاه :