معرفی GPT-4o: غول جدید دنیای هوش مصنوعی
مدل هوش مصنوعی GPT-4o برپایه مدل پرچمدار قبلی OpenAI ساخته شده اما از جهات مختلفی بهبود پیدا کرده است و میتواند برقراری ارتباط با این فناوری را سادهتر و پویاتر کند.
مدل هوش مصنوعی GPT-4o چیست؟
در مورد مدل هوش مصنوعی GPT-4o که به تازگی توسط OpenAI رونمایی شده، باید گفت که این مدل نسخه اصلاح شده از مدل زبانی GPT-4 به حساب میاد که به عنوان قلب تپنده چت بات معروف ChatGPT شناخته میشه. حرف o که در این مدل استفاده شده مخفف کلمه Omni و به معنی عالمگیر یا جهانیه.
میرا موراتی در مراسم رونمایی گفته که این مدل جدید بسیار سریعتر از نسخههای قبلیه و در درک متن و محتوای صوتی و تصویری عملکرد درخشانی داره.
معرفی قابلیتهای جدید مدل هوش مصنوعی GPT-4o
API مدل هوش مصنوعی GPT-4o دو برابر سریعتر و 50 درصد ارزانتر شده و محدودیت آن 5 برابر نسبت به GPT-4 توربو کاهش پیدا کرده است.
با GPT-4o میتوانید از دادهها، کدها و ابزارهای بینایی استفاده کنید تا برای مثال بتوانید تصاویر را تحلیل نمایید. یکی از ارتقاهای بزرگ این مدل جدید «گفتار زنده» است. GPT-4o میتواند به خود صدا گوش بدهد، بهجای اینکه ابتدا صدا را به متن تبدیل کند و بعد آن را بفهمد.
OpenAI مدعی شده که مدل هوش مصنوعی GPT-4o قدم بزرگی در جهت طبیعیتر شدن تعامل انسان با کامپیوتره؛ چون این مدل میتونه به طور میانگین در مدت زمان 320 میلی ثانیه به ورودیهای صوتی پاسخ بده. طبق این ادعا، زمان پاسخدهی این مدل از لحاظ سرعت مثل زمان پاسخدهی انسان موقع مکالمات روزانه است.
یکی دیگر از قابلیتهای مدل هوش مصنوعی GPT-4o اینه که این مدل می تونه صدای تنفس کاربر رو تشخیص بده و تکنیکهایی رو به اون توصیه کنه که سبب بهبود وضعیت تنفسی بشه. یکی از نکاتی که در این دمو قابل توجه بود این بود که GPT-4o میتونست بلافاصله پس از قطع شدن صدای کاربر حین مکالمه، به اون جواب بده. این قابلیت Voice Mode جدید حتی قادره با احساسات مختلف با کاربر حرف بزنه و مکالمه طبیعیتری رو شکل بده!
در یک دموی دیگر، کارمند OpenAI با دوربین موبایل خود یک معادله ریاضی را به GPT-4o نشان داد. از هوش مصنوعی خواسته شد تا در حل این معادله به او کمک کند، اما جواب نهایی را ندهد. در پاسخ، این سیستم مراحل حل یک معادله ساده را توضیح داد و تقریباً نقش یک معلم را ایفا کرد.
از دیگر قابلیتهای مدل هوش مصنوعی GPT-4o میشه به قابلیت تشخیص احساسات از چهره افراد اشاره کرد. در یک بخش از رویداد معرفی این مدل، یک چهره خندان به GPT-4o نشان داده شد که هوش مصنوعی پس از مشاهده حالت چهره رو تشخیص داد و به کاربر گفت: نمیخوای بگی دلیل خوشحالیت چیه؟
با استفاده از GPT-4o میتوانید منوی یک رستوران خارجی را به هوش مصنوعی نشان دهید و ترجمه آیتمهای داخل آن را دریافت کنید. این مدل همچنین قادر به ترجمه همزمان است. OpenAI میگوید در آینده حتی میتواند یک مسابقه ورزشی زنده را به ChatGPT نشان دهید و از هوش مصنوعی بخواهید قواعد آن را به شما توضیح دهد.
کاربران رایگان ChatGPT با استفاده از GPT-4o میتوانند به موارد زیر دسترسی پیدا کنند:
- تجربه هوشی در سطح GPT-4
- دریافت پاسخهای خود مدل و اطلاعات سطح وب
- تجزیهوتحلیل دادهها و ساخت نمودار
- گفتوگو درباره تصاویر شما
- آپلود فایل برای کمک به خلاصهسازی، نگارش یا تحلیل
- کشف و استفاده از جیپیتیها و جیپیتی استور
- بهرهمندی از تجربهای بهتر با قابلیت حافظه
بر اساس گفته OpenAI اکثر قابلیتهای مدل هوش مصنوعی GPT-4o به صورت تدریجی در دسترس همه کاربران قرار میگیره. همچنین این شرکت اعلام کرد که قابلیتهای متنی و تصویری این مدل از همین حالا در چتبات ChatGPT در دسترسه و میشه ازش استفاده کرد.
دیدگاهتان را بنویسید