نماذج تدرّبت على كميات هائلة من النصوص البشرية لتفهم اللغة وتُنتجها. تستطيع الكتابة والتلخيص والترجمة والإجابة على الأسئلة بأسلوب طبيعي.
ما الذي يجعل ChatGPT يكتب، وMidjourney يرسم، وElevenLabs يتكلم؟ في هذا الدرس نفكّ رموز GPT ونتعرف على المجالات الرئيسية التي يعمل فيها الذكاء الاصطناعي التوليدي.
الذكاء الاصطناعي التوليدي هو النوع القادر على إنتاج محتوى جديد — نصوص، صور، صوت، فيديو — بدلاً من مجرد التصنيف أو التحليل. إنه لا يسترجع إجابات محفوظة، بل يُركّب إجابات جديدة في كل مرة.
الذكاء الاصطناعي التقليدي يُجيب: "هذا البريد مزعج." — الذكاء الاصطناعي التوليدي يكتب: "عزيزي أحمد، أكتب إليك بشأن..."
GPT اختصار لثلاث كلمات تصف كيف بُني النموذج وكيف يعمل:
النموذج يُنتج محتوى جديداً — نص، صورة، كود — لم يكن موجوداً من قبل. يُركّب إجابته بدلاً من أن يسترجعها.
قبل أن تستخدمه، تدرّب النموذج على كميات ضخمة من النصوص من الإنترنت والكتب — مئات المليارات من الكلمات.
المعمارية التقنية التي تجعل النموذج قادراً على فهم السياق والعلاقات بين الكلمات بغض النظر عن بُعدها في الجملة.
GPT هو النموذج الذي طوّرته OpenAI ويعمل خلف ChatGPT. لكن هناك نماذج أخرى تتبع نفس الفكرة: Gemini من Google، Claude من Anthropic، Llama من Meta — كلها نماذج لغوية كبيرة تختلف في التفاصيل لا في المبدأ.
عندما تكتب سؤالاً لـ ChatGPT، يحدث هذا خلف الكواليس:
النص الذي تدخله يُسمى الـ Prompt
يحلّل كل كلمة وعلاقتها بما قبلها وما بعدها
يختار الكلمة الأكثر احتمالاً بناءً على ما تعلّمه
كلمة تلو كلمة حتى تكتمل الإجابة
النموذج يتنبأ بالكلمات الأكثر احتمالاً — لا يبحث في قاعدة بيانات للحقائق. لهذا قد يُخطئ أو يخترع معلومات تبدو منطقية. دائماً تحقق من المعلومات المهمة.
الذكاء الاصطناعي التوليدي لا يعمل في مجال واحد — هناك أربعة مجالات رئيسية، كل منها يتخصص في نوع مختلف من البيانات:
نماذج تدرّبت على كميات هائلة من النصوص البشرية لتفهم اللغة وتُنتجها. تستطيع الكتابة والتلخيص والترجمة والإجابة على الأسئلة بأسلوب طبيعي.
نماذج تتعامل مع الصور والفيديو — تستطيع توليد صور من نص، التعرف على الوجوه، قراءة المستندات، وتحليل مقاطع الفيديو.
مجال يُعنى بفهم اللغة البشرية وتحليلها — تحليل المشاعر، استخراج المعلومات، تحديد الموضوعات، والإجابة على الأسئلة من داخل النصوص.
المجال المكمّل لـ NLP — بدلاً من فهم النص يُنتج نصاً جديداً. يحوّل البيانات والأرقام والأحداث إلى جمل ومقالات مقروءة.
كثيراً ما يُخلط بين المصطلحَين — إليك الفرق بمثال واحد:
يقرأ النص الموجود ويُحلّله — يستخرج منه معنى، شعوراً، أو معلومة. المدخل نص، والمخرج فهم أو تصنيف.
يُنتج نصاً جديداً من بيانات أو تعليمات — يحوّل الأرقام والمعطيات إلى لغة مقروءة. المدخل بيانات أو طلب، والمخرج نص.
أدوات مثل ChatGPT وCopilot تجمع بين NLP وNLG في نفس الوقت — تفهم ما تكتبه (NLP) وتولّد رداً عليه (NLG). الفرق مهم نظرياً لكنهما عملياً وجهان لعملة واحدة.
| التطبيق | المجال | ما الذي يفعله بالضبط؟ |
|---|---|---|
| Google Translate / DeepL | NLP NLG | يفهم لغة المصدر ويولّد ترجمة طبيعية |
| فلتر البريد المزعج في Gmail | NLP | يقرأ محتوى البريد ويُصنّفه: مهم أم spam |
| Microsoft Copilot / ChatGPT | LLM | يُجيب على الأسئلة ويكتب ويُلخّص بلغة طبيعية |
| Face ID في الجوال | Computer Vision | يحلل صورة وجهك ويقارنها بالنموذج المحفوظ |
| تلقائي التسميات في YouTube | NLP NLG | يفهم الكلام المنطوق ويحوّله إلى نص مكتوب |
| DALL·E / Midjourney | Computer Vision | يُنتج صوراً جديدة بناءً على وصف نصي |
| تقارير BI التلقائية | NLG | يحوّل أرقام لوحة التحكم إلى ملخص مكتوب |