معرفی اپلیکیشن مستقل Grok یرای iOS ، چت بات Grok در مقابل ChatGPT: رقابت بر سر آینده هوش مصنوعی
به گزارش وبلاگ دیدگاه، Grok، ساخته شده به وسیله شرکت xAI که متعلق به ایلان ماسک است، اخیراً با عرضه یک اپلیکیشن مستقل برای iOS در آمریکا، حضور خود را در دنیای چت بات های پیشرفته رسمی نموده است. این ابزار که ابتدا به عنوان یک ویژگی ساده و آزمایشی در پلتفرم X (توییتر سابق) معرفی گردید، اکنون در حال رقابت با بازیگران بزرگی چون ChatGPT، Claude و Google Gemini است. قابلیت های Grok شامل پردازش اطلاعات زنده، پاسخ به سؤالات، فراوری تصاویر، و تحلیل داده ها است.
از دسامبر گذشته، xAI آزمایش های محدودی را روی اپلیکیشن مستقل Grok در کشورهای مختلف آغاز کرد و با گذشت زمان، آن را برای کاربران عمومی تر کرد. به تازگی این چت بات که ابتدا فقط برای مشترکین Premium X در دسترس بود، اکنون برای تمام کاربران به صورت رایگان عرضه شده است. این تغییر نشان دهنده تصمیم xAI برای رقابت مستقیم با سایر چت بات های رایگان مانند ChatGPT، Claude و Google Gemini است. بعلاوه، xAI در حال توسعه وب سایت اختصاصی Grok.com است که طبق اعلام، به زودی فعال خواهد شد.
هدف از مقایسه Grok و ChatGPT: شناسایی رجحانن عملکرد
در آزمایش های اجرا شده، ChatGPT و Grok در هفت بخش مختلف آنالیز شدند تا تعیین گردد کدام یک توانایی بیشتری در برآورده کردن نیازهای کاربران دارند. این آزمایش ها شامل فراوری تصویر، تحلیل تصویر، کدنویسی، نوشتن خلاقانه، حل مسئله، برنامه ریزی، و آموزش بود. هر دو چت بات با رویکردهای متفاوت و نقاط قوت خاص خود، در این رقابت حضور داشتند. این مقایسه، فرصتی برای ارزیابی عملکرد Grok به عنوان یک رقیب نوظهور در برابر ChatGPT بود که تا پیش از این، بارها در رقابت با سایر چت بات ها رجحان خود را نشان داده است.
1. فراوری تصویر: خلاقیت در جزئیات
در اولین آزمایش، از هر دو مدل خواسته شد تا یک تصویر خاص از محیط کار خانگی ایجاد نمایند که شامل عناصر تعیینی مانند میز ایستاده چوب بلوط روشن، صندلی سبز، مانیتور 34 اینچی، و یک گربه خاکستری باشد.
- ChatGPT با استفاده از مدل DALL-E، تصویری دقیق تر و نزدیک تر به درخواست ارائه داد که تمامی عناصر خواسته شده را شامل می شد. با این حال، تصاویر آن به طور واضح حالتی بیش از حد صیقلی و مصنوعی داشت.
- Grok توانست تصاویری طبیعی تر و نزدیک تر به عکس واقعی فراوری کند، اما در پیاده سازی دقیق جزئیات خواسته شده، دچار نقص هایی بود.
برنده: ChatGPT به علت تطابق بیشتر با درخواست کاربر.
2. تحلیل تصویر: عمق درک و جزئیات فنی
برای این بخش، تصویری از مأموریت آپولو 15 ناسا ارائه شد تا مهارت هر مدل در تحلیل تصاویر و ارائه جزئیات آنالیز گردد. از آن ها خواسته شد تجهیزات، محیط، و عناصر انسانی موجود در تصویر را شرح دهند و هدف کلی تصویر را تحلیل نمایند.
- ChatGPT توانست شرحاتی کلی ارائه دهد، اما جزئیات فنی و تحلیل دقیق در آن کمبود داشت.
- Grok با تحلیلی جامع تر، جزئیات دقیق تری از تجهیزات، فعالیت فضانوردان، و هدف مأموریت ارائه داد. توانایی آن در درک مفاهیمی مانند عایق حرارتی و محیط خلأ فضایی بسیار برجسته بود.
برنده: Grok به علت تحلیل جامع تر و درک فنی بهتر.
3. کدنویسی: کاربردی و قابل اجرا
از هر دو مدل خواسته شد یک تایمر پومودورو (Pomodoro Timer) در پایتون ایجاد نمایند که شامل یک رابط کاربری ساده با قابلیت های آغاز، توقف، و بازنشانی باشد.
- ChatGPT توانست کدی کامل و بدون نقص ارائه دهد که به طور مستقیم قابل اجرا بود، اما رابط کاربری ساده و فاقد مجذوب کنندهیت های بصری بود.
- Grok با ارائه کدی دارای نظرات مفید و طراحی رابط کاربری زیباتر، توجه بیشتری به جزئیات داشت، اما در اجرای برخی از قابلیت ها دچار نقص شد.
برنده: ChatGPT به علت ارائه کدی کامل و قابل اجرا.
4. نوشتن خلاقانه: قدرت داستان گویی
در این بخش، از چت بات ها خواسته شد داستانی کوتاه درباره دو نفر که در صف خرید یک محصول نو آشنا می شوند، بنویسند. داستان باید شامل سه تعامل میان شخصیت ها، جزئیات محصول، یک اتصال احساسی، و یک بازگشت به یک سال بعد باشد.
- ChatGPT داستانی متعادل با شخصیت پردازی قوی و دیالوگ های طبیعی نوشت که عناصر احساسی و ارتباط عمیقی ایجاد می کرد.
- Grok نیز داستانی مجذوب کننده و خوش ساخت ارائه داد، اما در اتصال عاطفی میان شخصیت ها به مقدار ChatGPT پیروز نبود.
برنده: ChatGPT به علت تعادل بهتر در ساختار و احساسات.
5. حل مسئله: راهکار های کاربرپسند
از مدل ها خواسته شد یک راهنمای عیب یابی برای خانه هوشمندی که در یک مهمانی شام دچار مشکلاتی مانند تغییر رنگ چراغ ها و قطع وصل موسیقی شده بود، ارائه دهند.
- ChatGPT راهکاری منطقی و ساختارمند ارائه داد، اما گاهی برای کاربران غیرتخصصی پیچیده به نظر می رسید.
- Grok با ارائه راهکار های ساده، کاربردی، و کاربرپسند توانست تجربه بهتری برای کاربران فراهم کند.
برنده: Grok به علت راهکار های ساده و مناسب برای کاربران غیرتخصصی.
6. برنامه ریزی: یک سفر تکنولوژی محور به توکیو
هر دو مدل مأمور شدند یک برنامه سفر سه روزه به توکیو با تمرکز بر جاذبه های تکنولوژی مانند آکیهابارا (Akihabara) طراحی نمایند. برنامه باید شامل هتل ها با بودجه های مختلف، زمان بندی فعالیت ها، و بودجه کلی باشد.
- Grok برنامه ای واقع بینانه تر با بودجه بندی دقیق و جزئیات بیشتری از هتل ها، حمل ونقل، و رستوران ها ارائه کرد.
- ChatGPT اگرچه برنامه ای منظم ارائه داد، اما در بودجه بندی و جزئیات برخی موارد کمتر دقیق عمل کرد.
برنده: Grok به علت دقت بیشتر در بودجه بندی و جزئیات.
7. آموزش: ابرها برای بچه ها 10 ساله
آخرین چالش به شرح شکل گیری ابرها و بارش باران برای بچه ها اختصاص داشت. هر مدل باید مفاهیم علمی را به زبانی ساده و با آزمایش های سرگرم نماینده شرح می داد.
- Grok توانست با استفاده از داستان گویی مجذوب کننده و پیشنهاد آزمایش هایی خلاقانه، توجه و تخیل بچه ها را بیشتر درگیر کند.
- ChatGPT نیز شرحاتی منطقی ارائه داد، اما در ایجاد مجذوب کنندهیت کمتر پیروز بود.
برنده: Grok به علت رویکرد خلاقانه تر و مناسب تر برای بچه ها.
نتیجه نهایی: رقابتی نزدیک اما پیروزیت Grok
با امتیاز نهایی 4 به 3، Grok توانست در این مقایسه نزدیک بر ChatGPT رجحان یابد. نقاط قوت Grok در تحلیل تصاویر، حل مسئله، برنامه ریزی، و آموزش به آن رجحان داد، در حالی که ChatGPT همچنان در کدنویسی و نوشتن خلاقانه پیشتاز بود. این رقابت نشان داد که Grok، با وجود نو بودن، توانسته است به سرعت پیشرفت کند و به عنوان رقیبی جدی برای ChatGPT مطرح گردد.
تذکر: این آزمایش که به وسیله tomsguide محدود بوده و به نظر شخصی من هنوز ChatGPT رجحان کامل بر Grok دارد. اما تنوع هوش های مصنوعی باعث رقابت مثبت بین آنها و بهره مندی کاربران می تواند باشد و در برخی کاربردهای خاص، می توان علاوه بر هوش مصنوعی انتخابی از موارد فرعی هم استفاده کرد.
منبع: یک پزشک