روی تازه هوش مصنوعی، هوش از سر میبرد!
این روزها بازار هوش مصنوعی داغ است و هر روز هنرنمایی تازهای میکند. تواناییهایی دارد که خیلی کسب و کارها از جمله ارائه کنندگان آنلاین ویدئو را به چالش کشیده است.
بامداد زندباف: هوش مصنوعی مولد نوعی از هوش مصنوعی است که اگر توسط مجموعه داده های عظیم تعلیم داده شود می تواند با پیش بینی کلمه یا پیکسل بعدی متن, عکس, صدا یا ویدیو تولید کند. ساده ترین ورودی برای هوش مصنوعی مولد, متن توصیفی( یا اعلان) است. بر اساس متن داده شده, مبدل از پیش آموزش دیده (GPT) می تواند پاراگرافی بنویسد, مدل متن به تصویری مثل استیبل دیفیوژن می تواند تصویر تولید کند, موزیک ال ام می تواند موسیقی تولید کند و ایمجن ویدئو(Imagen Video) میتواند ویدئو بسازد. این فناوری تمام اشکال تولید محتوا را تحت تاثیر قرار خواهد داد. در زمینه تولید ویدئو این فناوری می تواند از موبایل و شبکه های مجازی هم انقلابیتر عمل کند. این فناوری همچنین صنعت تولید ویدئو را از پایه تغییر می دهد.
بلندپروازانهترین پروژه محمد بن سلمان
نتفلیکس, تیک تاک و یوتیوب حکم رانان این عرصه را در نظر بگیرید. با اینکه هر کدام از نظر تولید محتوا و مدل کسب و کار منحصر به فرد هستند ولی هر سه تای آنها با تشویق تولید کنندگان به تولید محتوای سرگرم کننده, تطبیق محتوا با مصرف کننده مناسب و شناسایی محتوای تعامل برانگیز به فعالیت خود ادامه می دهند. هر کدام از این سه عامل دست به دست هم داده اند تا چرخه ای بسازند که به این سه پلتفرم کمک کند تا بازدیدکنندگان را جذب کنند. اما این چرخه در حال از دست دادن شتاب خود است. هوش مصنوعی مولد با تولید زنجیره ارزش جدید برای تولید محتوای ویدئویی مشکلات آنها را بیشترهم خواهد کرد.
نتفلیکس, تیک تاک و یوتیوب در خطر هستند
نتفلیکس , تیک تاک و یوتیوب به لطف توانایی خود در تعیین اهمیت و جذابیت محتوا عمل کرد خوبی داشته اند. آن ها به داده های فراوانی دسترسی دارند که تعیین می کنند هر شخص به چه طریقی چه چیزی تماشا می کند. با وجود موفقیت آنها تعیین اینکه هر شخص “چه چیزی” تماشا می کند دو چالش بزرگ پدید آورده.
جمع آوری ویژگی های دقیق و بدرد بخور: اگر یک ویدئو قراردادی باشد( مثل فیلم های موجود در نتفلیکس) در دسته بندی هایی مثل ژانر, بازیگران, مدت زمان فیلم و … قرار می گیرد. ولی این دسته بندی های کلی و بعضی اوقات سلیقه ای هستند, که یادگیری آن را برای یک الگوریتم سخت می کند. البته خیلی از ویژگی های یک ویدئو را می توان مشخص کرد مثل متن نمایشنامه, فهرست برداشت ها و دیگر مشخصات تولید که دقیقا مشخص است. ولی تلاش برای استفاده از این اطلاعات باعث به وجود آمدن مشکل دیگری شد. ممکن است اطلاعات زیادی برای توصیف یک ویدئو وجود داشته باشد.
غلبه بر موانع موجود برای تولید: تولید محصولی هالیودی و انحصاری فرایند آهسته و هزینه بر است. نتفلیکس در سال ۲۰۲۲, ۱۷ میلیارد دلار برای تولید محتوا هزینه کرد. گرگ پیترز مدیر عامل نتفلیکس می گوید: ولی اگر ما بتوانیم هر هفته سریالی مثل ” چهار شنبه(WEDNESDAY)” یا ” گلس آنین(GLASS ONION)” بسازیم, بخش زیادی از بینندگان را پس می گیریم.” بدون شک آنها مدل ساخت سریال فعلی خود نمی توانند هر هفته سریالی مثل ونزدی( اقتباسی پرطرفدار با بودجه بالا از فیلم خانواده آدامز) بسازند.
مدل دیگر تولید محتوا که تیک تاک و یوتیوب از آن استفاده می کنند, استفاده از محتوای تولید شده توسط کاربران است. با اینکه این روش ارزان و سریع تر است ولی مستلزم تعیین سه مشوق است تا بین سه هدف تعادل ایجاد کند ۱: حفظ تولید کنندگان پرنفوذ ۲: تشویق تولید کنندگان تازه وارد ۳: حفظ و رشد شالوده بازدید کنندگان. پلتفرم های فعال در این زمینه با تلاش برای تولید مقدار مناسب محتوای سرگرم کننده توسط گروه کوچکی از تولیدکنندگان پرطرفدار, آتش جنگ انگیزشی را برافروخته اند. برای مثال گفته می شود تیک تاک برای تبلیغ دستی ویدئو ها از قابلیتی به نام “heating” استفاده می کند. در حالی که ویدئوهای کوتاه یوتیوب, برای در آمد بیشتر تولید کنندگان شرایط را آسان تر کرده( برای تولید این نوع ویدئو ها در یوتیوب به ۱۰۰۰ دنبال کننده نیاز دارید در حالی که در تیک تاک باید حداقل ۱۰۰ هزار دنبال کننده داشته باشید.)
این دو چالش به نوعی دلیل شکست پلتفرم پخش زنده Quibi را که عمر کوتاهی داشت, توضیح می دهد. Quibi ضعف های این سه پلتفرم را در یک پلتفرم خلاصه کرده بود. آن ها با استخدام تولید کنندگان و بازیگران گران قیمت, هزینه تولید محصولات انحصاری هالیوود مانند را دو برابر کرده بودند. آنها به جای اینکه مانند تیک تاک و یوتیوب به تولید کنندگان فردی بها دهند, تمرکز خود را معطوف تولید کنندگان و بازیگران مشهور کردند. در عوض آنها محتوای ضعیف( ومعمولا درجه دو) که اصلا مناسب نبود تولید کردند. این اتفاق به این دلیل رخ داد که مخاطبین هدف آنها نسل جوان بود اما از تولید کنندگان این گروه سنی استفاده نکرد. همچنین, در کمال شگفتی, آنها از هوش مصنوعی برای تعیین محتوای مورد نیاز برای تولید استفاده نکردند.( البته از هوش مصنوعی برای پیشنهاد اینکه تماشگران چه چیزی تماشا کنند استفاده کردند)
تا به حال هیچ پلتفرمی که توسط انسان کنترل می شود نتوانسته از این دو چالش سربلند بیرون بیاید. با این حال احتمالا راه حلی وجود دارد. هوش مصنوعی مولد ویدئوهایی که تولید می شوند, نحوه تولید آنها و اینکه چه کسی آنها را تماشا می کند را تغییر خواهد داد و نوع جدیدی از پلتفرم مجهز به هوش مصنوعی را به وجود خواهد آورد.
پیش به سوی پلتفرم های مولد
این شرایط را تصور کنید. تولید کننده ای متن زیر را به هوش مصنوعی می دهد: «دو نفر در کافه آرت دکو نشسته اند. بیرون برف می بارد. یکی از آنها گازی به پنیر سوییسی خود می زند و می گوید” من خلاقانه یبوست دارم.”» یک ویدئو واقع گرایانه ولایو اکشن( با صدا) تقریبا بلافاصله تولید می شود و در دسترس میلیاردها بیننده قرار می گیرد ما نه تنها می دانیم چه کسی چه مدت تماشا کرده است، چه کسی چه قسمت هایی را نادیده گرفته است، لایک ها، اشتراک گذاری ها، نظرات، جستجوها و همه بحث های خارج از پلتفرم در مورد ویدیو، بلکه ورودی دقیق استفاده شده برای ایجاد آن ویدیو را نیز می دانیم. در یک بخش, این سناریو بر دو چالشی که پلتفرمهای ویدئویی موجود با آن دست و پنجه نرم می کنند غلبه می کند. ان فناوری توضیح دقیق تری از ویدئو ارائه می دهد( اعلان متن ورودی به هوش مصنوعی), و موانع تولید را تا حد زیادی از پیش رو بر می دارد.( به سادگی با تایپ کردن تخیلات خود می توانید محتوا تولید کنید) دیگر نیازی نیست با برنامه کپ کات یا حتی بازیگران سر و کله بزنید.
این رویایی به نظر می رسد( در واقع هم چنان یک رویا هست چون این فناوری هنوز وجود ندارد) اما این مجموعه ای از سه برنامه هوش مصنوعی خواهد بود. هوش مصنوعی اول بر اساس متن داده شده ویدئو را تولید می کند, هوش مصنوعی دوم ویدئو را در معرض دید تماشاگران مناسب قرار می دهد و هوش مصنوعی سوم از بازخوردهای موجود استفاده می کند تا تولید کنندگان را برای تولید محتوای بعدی راهنمایی کند. نسخه ابتدایی تر این روش تولید در حال تولید است. شاید مهم ترین آن سیت کام کمدی ساین فیلد”هیچ برای همیشه” باشد که از هوش مصنوعی مولد برای نوشتن فیلم نامه استفاده می کند و بیش ۱۰۰ هزار دنبال کننده دارد.
پلتفرم های ویدئویی که توسط هوش مصنوعی مولد اداره می شوند با راهنمایی تولید کنندگان و نشان دادن محتوای مرتبط به تماشاگران, موانع موجود در ایجاد ارزش در تولید را کاهش می دهند.هم زمان, این موانع کاهش یافته و راهنمایی ها به سازندگان این امکان را می دهد تا ارزشی را که می توانند در خارج از شرکت ایجاد کنند افزایش دهند. و به لطف ارتباط نزدیک به صفر دو طرف در تولید و تماشای محتوای مرتبط, تولید کنندگان هم تماشاگر هستند و برعکس. اگر تماشگر بتواند متنی را جست و جو کند, م آن متن تبدیل به اعلانی برای برای ویدئو جدید بشود, این مرز باریک تر هم خواهد شد.
تاثیر اقتصادی این فرآیند عظیم خواهد بود. از قدیم, درصد کمی از محتوای خیلی محبوب در یک پلتفرم مقدار زیادی از محتوای کم طرفدار جبران می کند. پلتفرم مبتنی بر هوش مصنوعی مولد موفقیت محتوای محبوب را افزایش می دهد چون تولید کنندگان به لطف توصیه های الگوریتمی می دانند در مرحله بعدی چه محتوایی باید بسازند. در عین حال, موانع بسیار کم تر برای تولید سود دیگران را هم افزایش خواهد داد.
پلتفرمهای پیشرو فعلی چگونه سازگار خواهند شد؟ از این سه پلتفرم, نتفلیکس بیشتر روی مدل کسب و کار خود تمرکز کرده و بعید است تغییر بزرگی ایجاد کند. آنها مدت ها بود در برابر روشی مبتنی بر تبلیغات مقاومت می کردند و به تازگی شروع به حرکت در این مسیر کرده اند. تیک تاک از نظر مدل کسب و کار, توانایی ها و انعطاف پذیری نسبت به آنچه می بینیم نزدیک ترین پلتفرم به هوش مصنوعی مولد است, اما در ایالات متحده تحت بررسی های نظارتی است. یوتیوب تلاش زیادی کرده و با معرفی ویدئوهای کوتاه و تشویق تولیدکنندگان در موقعیت مطلوب تری قرار دارد. آنها همچنین حامی توانایی های هوش مصنوعی گوگل هستند. با این حال گوگل قبلا نشان داده از نظر تجاری در زمینه هوش مصنوعی مولد به کندی عمل می کند.
این تازه شروع راه است
پیشرفت های اخیر در زمینه فنی و آگاهی هوش مصنوعی مولد چشمگیر بوده. در حال حاضر فناوری لازم برای تولید فیلم های واقع گرایانه و لایو اکشن از یک نوشته را نداریم, و وجود چنین فناوری کلید ساخت پلتفرم های جدید است.
حتی زمانی که این فناوری در دسترس قرار بگیرد, شاید نتواند تصویر دقیقی از نوشته های وارد شده ارائه دهد و این پلتفرم احتمالا تعداد زیادی ویدئو مشابه تولید می کند که با نوشتن متن های مشابه توسط تولیدکننده- بیننده پایدار تر خواهد شد. و وقتی این پلتفرم روش تولید محتوای جذاب را یاد بگیرد, ، تضاد منافع بین پلتفرم و سازندگان چگونه مدیریت خواهد شد؟ این پلتفرم چگونه از تولید ویدئو های دیپ فیک غیر مجاز,تبلیغات اجتناب ناپذیر و اطلاعات غلط جلوگیری خواهد کرد.
علیرغم این اخطارها, احتمالا هوش مصنوعی مولد باعث به وجود آمدن پلتفرم ویدئویی جدیدی می شود که یا جایگزین تیک تاک, یو تیوب و نتفلیکس می شود, یا حداقل محتوای آنها را تامین می کند فناوری هوش مصنوعی مولد نه تنها برای تولید محتوا بلکه برای تقویت پویایی پلت فرم در بین پلتفرم، سازندگان و مصرف کنندگان نیز استفاده خواهد شد. واضح است که تمام این موارد همراه با عدم اطمینان به فناوری و وجود خطرات اخلاقی است. و البته ویدئو یکی از زمینه هایی است که انتظار می رود چنین تغییر سریعی را در آن ببینیم. حوزه های خلاقانه دیگری مثل هنر, موسیقی و کلام نوشتاری منتظر تغییرات بزرگ و فرصت های تجاری جدید هستند.( یا حداقل افرادی که از هوش مصنوعی مولد در این زمینه استفاده می کنند منتظر این تغییرات هستند)