اپلیکیشنهای مترجم صدای گربه چگونه کار میکنند؟
اگر صاحب گربه هستید، احتمالا با اپلیکیشنهایی که مدعی ترجمهی صدای گربه هستند، روبهرو شدهاید. اما آیا واقعا این اپلیکیشنهای مترجم صدای گربه کارایی دارند؟ در پاسخ به این پرسش باید بگوییم که این ادعا تا حدی صحت دارد. بخشی از پیچیدگی قضیه به منحصربهفرد بودن زبان هر گربه برمیگردد اما به لطف فناوریهای جدید، در این زمینه پیشرفتهای قابل توجهی صورت گرفته که در ادامه به این موضوع میپردازیم.
تشخیص گفتار و یادگیری ماشینی
تشخیص گفتار به زبان ساده مبتنی بر ضبط گفتار و تبدیل آن به یک فایل دیجیتالی است. سپس نرمافزار بخشهایی از این فایل را کدگذاری و تحلیل میکند تا بتواند منظور فرد را متوجه شود. این کدگذاریها با توجه به صدای پسزمینه و نحوهی صحبت کردن فرد بسیار متفاوت محسوب میشود.
ما گاهی اوقات تکنولوژی تشخیص صدا را یک امر بدیهی در نظر میگیریم اما باید بگوییم که یک شاهکار در حوزهی تکنولوژی به حساب میآید. روی هم رفته هر کلمه شامل طیف گستردهای از صداها یا آواها است که با یکدیگر ترکیب میشوند و در نتیجه کامپیوتر برای تشخیص و درک گفتار انسان باید فرایند بسیار پیچیدهای را پشت سر بگذارد. از طرف دیگر، تشخیص صدای گربه از این هم سختتر به نظر میرسد.
اپلیکیشنهای فعال در حوزهی تشخیص گفتار از مجموعه داده یا دیتاست استفاده میکنند که از میلیونها کلمه تشکیل شده است. سپس این اپلیکیشن تلاش میکند گفتار شما را با نزدیکترین کلمات ذخیره شده در بانک اطلاعاتی خود تطبیق دهد. زمانی که مرتکب اشتباه میشود و شما آن را اصلاح میکنید، دادههای جدید را برای دفعهی بعدی ذخیره میکند. این فرایند بخشی از یادگیری ماشینی محسوب میشود.
سیستمهای تشخیص صدا هنوز مشکلات مختلفی دارد که این مشکلات برای افراد دچار اختلال گفتاری و لهجه بیشتر است. با این حال، سیستمهای تشخیص گفتار روزبهروز بهتر میشوند. اما در نهایت سؤالی که مطرح میشود این است که آیا این رویکرد برای اپلیکیشنهای مترجم صدای گربه هم جواب میدهد؟
تشخیص گفتار انسان در برابر تشخیص صدای گربه
اول از همه باید درک کنیم چرا ترجمهی نوع خاصی از صدای گربه به «من گرسنه هستم» با تجزیه و تحلیل گفتار انسان تفاوت دارد. از طرف دیگر، مشکل بزرگتر این است که گربهها تا حد زیادی با نشانههای غیرکلامی مانند حالت بدن خود، پیام را منتقل میکنند. همچنین باید به فقدان زبان بینالمللی گربهها هم اشاره کنیم.
روی هم رفته، کارشناسان میگویند که صدای گربه باید به همراه حالت بدن و شرایط بررسی شود. در ضمن هر گربهای زبان خاص خود را دارد. طبق بررسیهای صورت گرفته، گربهها زبان شخصیسازی شده برای صاحبان خود را ایجاد میکنند. بنابراین با توجه به این محدودیتها، اپلیکیشنهای مترجم صدای گربه چگونه میتوانند برای تمام گربهها انجام وظیفه کنند؟
یادگیری ماشینی انعطافپذیر برای گربهها
اگرچه چند دستیار مجازی مانند Oto برای درک لحن و احساس ارائه شدهاند، اما سیستمهای تشخیص گفتار در زمینهی سیگنالهای غیرکلامی هنوز عملکرد خوبی ندارند. اما این موضوع به معنای غیرممکن بودن تفسیر این اطلاعات نیست.
یکی از اپلیکیشنهای مترجم صدای گربه MeowTalk نام دارد که که برای غلبه بر این مشکلات، از نوعی یادگیری ماشینی انعطافپذیر بهره میبرد. این اپلیکیشن توسط خاویر سانچز توسعه پیدا کرده که یکی از اعضای تیم دستیار هوشمند الکسا از شرکت آمازون بوده است. به نظر او، این اپلیکیشن یک گام در راستای حرکت به سمت قلادههای هوشمند به حساب میآید. این قلادهها قرار است با بهرهگیری از الگوریتمهای بسیار پیشرفته، به انسانها برای درک بهتر گربههای خود کمک کنند.
در این اپلیکیشن، برای هر گربه باید پروفایل جداگانهای ایجاد کنید. طبق پژوهشهای صورت گرفته، صدای یک بچه گربه با صدای گربهی بزرگسال تفاوت دارد و به همین خاطر اپلیکیشن از شما میخواهد که تاریخ تولد گربهی خود را هم وارد کنید. هر پروفایل یک شبکهی داده منحصربهفرد برای گربه ایجاد میکند.
در ابتدا، این اپلیکیشن کار خود را با ۱۰ پروفایل صدا آغاز میکند که هر کدام نشاندهندهی معناهای مختلف مانند «شاد بودن» یا «حالت شکار» هستند. زمانی که اپلیکیشن صدایی را میشنود و اشتباه تشخیص میدهد، میتوانید آن را اصلاح کنید یا اینکه پروفایل جدیدی برای آن صدای ایجاد کنید.
سیستمهای یادگیری ماشینی مربوط به اپلیکیشنهای تشخیص گفتار معمولا در برابر این اصلاحات مقاومت میکنند. اما یادگیری ماشینی انعطافپذیر این اپلیکیشن به کاربران اجازه میدهد که بهراحتی اصلاحات زیادی را اعمال کنند. به مرور زمان و با اصلاح و اضافه کردن صداهای مختلف، میتوانید یک پروفایل شخصیسازی شده برای گربهی خود را ایجاد کنید.
آیا اپلیکیشنهای مترجم صدای گربه واقعا کار میکنند؟
در نهایت، عملکرد این نوع اپلیکیشنها تا حد زیادی به خود کاربر بستگی دارند زیرا باید نحوهی صحبت کردن گربهی خود را به اپلیکیشن آموزش دهند. با توجه به اینکه گربهها زبان یکسانی ندارند، این رویکرد تغییر چندانی نخواهد داشت.
اما این واقعیت که یادگیری ماشینی تا این حد پیشرفت کرده و میتواند حتی تا حدی در این زمینه موفق باشد، باورنکردنی است. یادگیری ماشینی و دیگر حوزههای هوش مصنوعی با سرعت فوقالعادهای روزبهروز بهتر میشوند و طی سالهای آینده، پیشرفتهای هیجانانگیزی را امکانپذیر میکنند.