بسیاری از کاربران هنگامی که از هوش مصنوعی چت جی پی تی استفاده میکنند، به این فکر میافتند که واقعاً این سیستم چگونه پاسخهای خود را تولید میکند. در حالی که توضیح کامل این فرآیند به علت پیچیدگی آن دشوار است، اما در اینجا سعی کردهایم به زبانی ساده مراحل کلی کار این مدل را توضیح دهیم. با این اطلاعات، شاید بتوانید بهتر درک کنید که وقتی سوالی از ChatGTP میپرسید، چگونه به پاسخ شما میرسد.
چت جی پی تی چگونه کار می کند؟
مرحله اول: ذخیرهسازی اطلاعات در قالب کدهای عددی
چت جی پی تی مانند یک دوست پرمطالعه است که اطلاعات زیادی از هزاران کتاب و مقالات آنلاین به دست آورده است. اما این اطلاعات را به همان شکل که ما میخوانیم و درک میکنیم، ذخیره نمیکند. بلکه همه چیز در قالب «کدهای عددی» یا توکنها در ذهن این مدل ذخیره میشود. این کدها دادههای متنی را به اعداد و بردارهای ریاضی تبدیل میکنند، که به آن اجازه میدهد تا دادهها را پردازش کند.
به عنوان مثال، وقتی شما از چت جی پی تی سوالی میپرسید، این مدل به بخشهای مختلفی از دادههای ذخیرهشده خود مراجعه میکند تا مرتبطترین توکنها را بازیابی کرده و پاسخی مناسب ارائه دهد.
مرحله دوم: تبدیل کلمات به توکن
هنگامی که شما سوالی از چت جی پی تی میپرسید، ابتدا باید سوال شما را به زبانی که خود مدل میفهمد، یعنی زبان ریاضی و کدهای عددی، ترجمه کند. این فرآیند با تجزیه کلمات به توکنها شروع میشود. هر کلمه یا عبارت، به یک نقطه در فضای ریاضی مدل تبدیل میشود. به عنوان مثال، اگر بپرسید «علی دایی فوتبال بازی میکند؟»، چت جی پی تی میتواند بفهمد که «علی دایی» و «فوتبال» با هم مرتبط هستند و موقعیت این دو مفهوم را در فضای ریاضی خود تشخیص دهد.
مرحله سوم: فیلتر کردن اطلاعات با استفاده از فیلترهای هوشمند
چت جی پی تی برای آنکه بتواند پاسخ مناسبی ارائه دهد، نیاز به فیلتر کردن اطلاعات نامرتبط دارد. این مدل از فیلترهای هوشمندی مانند ReLU (واحدهای خطی اصلاح شده) استفاده میکند که به او کمک میکند تنها اطلاعات مرتبط و مهم را نگه دارد. برای مثال، اگر شما سوالی درباره «علی دایی» بپرسید، ChatGPT به طور خودکار اطلاعاتی را که واقعاً به او و فوتبال مرتبط هستند انتخاب میکند و سایر اطلاعاتی که ممکن است نامرتبط باشند، کنار میگذارد.
مرحله چهارم: ترکیب اطلاعات برای ارائه پاسخ
پس از فیلتر کردن اطلاعات، چت جی پی تی توکنهای مرتبط را مانند قطعات پازل کنار هم قرار میدهد تا به شما پاسخ دهد. برای مثال، وقتی میپرسید «آسمان چه رنگی است؟»، این مدل توکنهای مرتبط با آسمان و رنگ را ترکیب میکند و با استفاده از دادههایی که از قبل دارد، به پاسخ میرسد که «آسمان آبی است». البته این پاسخها صرفاً از روی الگوهایی که مدل قبلاً دیده، انتخاب میشود و بر پایه درک واقعی نیست.
آیا چت جی پی تی واقعاً «میفهمد»؟
شاید از خود بپرسید آیا ChatGPT واقعاً میفهمد که چه میگوید؟ پاسخ این است که خیر، چت جی پی تی مانند انسانها فکر نمیکند و هیچگونه احساسی ندارد. او صرفاً با الگوهای متنی کار میکند. هنگامی که سوالی از او پرسیده میشود، با توجه به الگویی که از متنهای قبلی دیده، پاسخی را انتخاب میکند که به نظرش با سوال شما همخوانی دارد.
چرا ChatGPT گاهی اشتباه میکند؟
چت جی پی تی بر اساس الگوبرداری از متنهای قبلی پاسخها را تولید میکند. بنابراین، ممکن است گاهی اشتباه کند یا حتی اطلاعات ناقصی ارائه دهد. مثلاً تصور کنید دوستی داستانی را که شنیده برای شما تعریف کند. ممکن است برخی جزئیات را فراموش کند یا اشتباه بیان کند. به همین ترتیب، چت جی پی تی نیز ممکن است به دلیل کامل نبودن یا نادرست بودن دادههای ورودی، در برخی موارد پاسخهای نادرست ارائه دهد.
جمعبندی
در این مقاله تا حدودی به جواب سوال “چت جی پی تی چگونه کار می کند” رسیدیم و فهمیدم که مدلهایی مانند چت جی پی تی که با عنوان مدلهای زبانی بزرگ (LLM) شناخته میشوند، از روشهای پیچیده و هوشمندانه برای ذخیره و پردازش اطلاعات بهره میبرند و به کمک این تکنیکها به سوالات کاربران پاسخ میدهند، داستان میگویند و پیشنهاد میدهند. اما همه اینها بر اساس الگویی است که از دادههای قبلی یاد گرفتهاند. بنابراین، نمیتوان آن را با فکر کردن و فهمیدن انسان مقایسه کرد. ChatGPT شبیه به یک کتابخانه بزرگ است که هر کلمه یا جملهای که به آن میدهید، به پاسخ مرتبطی از همان کتابخانه هدایت میشود.
این مدلها هر روز پیشرفت میکنند، اما هنوز از معماریهای پرهزینه و منابع محدود استفاده میکنند. متخصصان در تلاش هستند تا مدلهای کوچکتر و بهینهتری بسازند که هم مصرف انرژی کمتری داشته باشند و هم بتوانند بهتر و سریعتر مفاهیم را درک کنند.