تصوير Mpho Mojapelo على Unsplash

واجهات برمجة تطبيقات AI: ما هي وكيفية استخدامها

مجموعة من أفضل الممارسات لواجهات برمجة التطبيقات للذكاء الاصطناعي

هل أنت فضولي بشأن واجهة برمجة تطبيقات تحويل الكلام إلى نص أو ترجمة لغة أو واجهة برمجة تطبيقات للتعرف على الصور؟ انت محظوظ! هناك الكثير من الخدمات التي تتيح لك القيام بذلك ، وأيضًا الكثير من الأسباب لاستخدام واجهات برمجة التطبيقات للذكاء الاصطناعي (AI) في تطبيقاتك. في هذه المقالة ، سنصف بعض حالات الاستخدام لواجهات برمجة تطبيقات AI ، ثم نتحدث عن أفضل الممارسات التي يجب اتباعها عند استخدامها.

إذا كنت في عجلة من أمرك ، فانتقل إلى TL ؛ DR في الأسفل.

السؤال الأول قبل تنفيذ خدمة خارجية عليك أن تسأل نفسك هو "هل أحتاج هذا"؟ عندما يتعلق الأمر بواجهات برمجة التطبيقات المستندة إلى الذكاء الاصطناعي ، يمكن أن تصبح الإجابة معقدة! لمساعدتك في اتخاذ القرار ، دعنا نلقي نظرة على اثنتين من الخدمات الأكثر استخدامًا ، ومتى يجب عليك (أو لا يجب) استخدامها.

حالة الاستخدام رقم 1: تحويل الكلام إلى نص

تستفيد العديد من التطبيقات اليوم من إمكانات تحويل الكلام إلى نص - وربما تكون قد استخدمت بالفعل واحدة تفعل ذلك. يستخدمه Siri أو Google Assistant أو Bixby أو Alexa ، ولكن هذا ليس كل شيء. كما أنها تستخدم من قبل تطبيقات المراسلة (مثل WhatsApp) ومحركات البحث (مثل شريط البحث في Google).

قد تتساءل أين يوجد AI في هناك. أليس هذا مجرد نسخ الكلام؟

أساس أي واجهة برمجة تطبيقات تحويل الكلام إلى نص هو في الواقع أخذ صوت الكلام كمدخل وتحويله إلى نص ، على الرغم من أنه لن يتوقف هنا ، وهنا يحدث سحر الذكاء الاصطناعي. بالنسبة لمعظم واجهات برمجة التطبيقات المتاحة ، ستقوم أيضًا بـ:

  • تعديل النسخ السابق بناءً على السياق
  • تحديد مكبرات الصوت المختلفة
  • تكون قادرة على البحث عن كلمات رئيسية محددة
  • السماح بتخصيص النموذج (مفيد لللهجات الإقليمية)

استخدم هذا: لحالات استخدام محددة ، مثل أثناء تركيب الكلام أثناء التجربة حيث يكون السياق والكلمات المستخدمة والمتحدث الحالي مهمًا كثيرًا.

لا تستخدم هذا: إذا كنت تتوقع فقط مكبر صوت واحد أو لمراسلة نصية بسيطة. في هذه الحالة ، تحتوي معظم لوحات مفاتيح الهواتف الذكية بالفعل على إمكانية التعرف على الكلام التي يمكن استخدامها ولتطبيق الويب يمكنك استخدام SpeechSynthesis API.

حالة الاستخدام رقم 2: التعرف على الصورة

مقارنة بالكلام إلى نص ، هناك عدد قليل من التطبيقات التي تستخدم التعرف على الصور في الوقت الحاضر ، ومعظمها محدد تمامًا (مثل PlantNet يحدد النباتات التي تلتقط صورة لها). على الرغم من ذلك ، بدأنا نرى بعض الاستخدام العام لها ، على وجه التحديد مع:

  • Google Lens: يحلل ما يظهر على شاشتك (صورة أم لا) وسيحاول تحديد العناوين والأماكن والأشياء والتوصية بالنتائج بناءً عليها
  • رؤية الذكاء الاصطناعي: تطبيق لضعاف البصر يصف ما حولهم (بناءً على المكان الذي تشير إليه كاميرا الهاتف)
استخدام Google Lens للتعرف على المكان

كما ستفهم الآن ، فإن السحر هنا هو التقاط صورة كمدخل ومحاولة تحديد ما في الصورة المذكورة. بالنسبة لمعظم مقدمي الخدمات ، هناك طريقتان للقيام بذلك:

  • استخدام النماذج المدربة مسبقًا: وهي تشمل الفصول الشائعة (الطعام والأماكن والأشخاص والألوان ...)
  • استخدام المصنفات المخصصة: تتيح هذه للمستخدمين تدريب فصولهم الخاصة (كما هو موضح مع PlantNet أعلاه)

على الرغم من أن بعض أجهزة Android و iOS لديها إمكانات التعرف على الصور المضمنة ، كمطور ، لا يمكنك دائمًا الاستعلام عنها من تطبيقك. لذلك طالما أن حالة الاستخدام الخاصة بك مناسبة ، فيجب عليك استخدامها.

حالة الاستخدام # 3 ، # 4 ...

هناك الكثير من واجهات برمجة التطبيقات AI الأخرى هناك. لن نتناولها جميعًا في هذا المنشور ، ولكن إذا كنت تفكر في استخدام أحدها ، ولست متأكدًا مما إذا كانت حالة الاستخدام الخاصة بك تناسب الحاجة أم لا ، فاترك تعليقًا أو اتصل بي مباشرة. سأكون سعيدًا لمساعدتك!

لقد قررت الآن استخدام واحد أو اثنين أو أكثر (في هذه الحالة ، إليك مقالة لك) APIs AI في تطبيقك. سنرى في هذا القسم بعض الممارسات الأفضل التي يجب اعتمادها قبل التفكير في استخدامها في الإنتاج.

جرب قبل أن تشتري

كما هو الحال مع كل واجهة برمجة تطبيقات تابعة لجهة خارجية ، هناك معلمات يجب مراعاتها - السعر ، وسهولة الاستخدام ، والتوفر ... ولكن عندما يتعلق الأمر بالذكاء الاصطناعي ، هناك أيضًا عامل موثوقية يدخل في الاعتبار. معدل t 0 أو 1. في الواقع سيكون أي شيء بين 0 و 1 كما سنرى في القسم التالي!

يوفر جميع مزودي السحابة الرئيسيين مجموعة خاصة بهم من واجهات برمجة تطبيقات AI ، ولديهم إما صفحة عرض أو تجربة مجانية. استفد من ذلك ، جرب بنفسك ، واختر الخيار الذي يحصل على أفضل النتائج!

  • آي بي إم واتسون
  • Google Cloud AI
  • خدمات Microsoft المعرفية
  • خدمات AWS AI

هناك أيضًا منصات لخدمات معينة مثل Clarifai (Vision API) ، SAP Conversational AI (Chatbots) ، أو بحث بسيط عن محرك البحث المفضل لديك هنا.

مثال على استدعاء خدمة Watson Assistant باستخدام Postman

الذكاء الاصطناعي يقفي بثقة

كما تم الحديث عنه في القسم السابق ، في كل مرة ستحصل على رد من واجهة برمجة تطبيقات AI ، فستحتوي أيضًا على مستوى ثقة يتراوح من 0 إلى 1 والذي يتوافق مع النسبة المئوية من اليقين الذي تعرف عليه لشيء ما.

لنأخذ مثالاً باستخدام واجهة برمجة تطبيقات Visual Recognition ، عند إرسال الصورة التالية:

ائتمانات: Getty.com

إليك رد JSON. لقد أزلت بعض الفصول لقراءتها.

[{"classifier_id": "default"، "name": "default"، "classes": [{"class": "bus"، "Score": 0.797}، {"class": "mechanical device"، " النتيجة ": 0.506} ، {" class ":" Indian red color "،" Score ": 0.799}]،" display ":" General Model "،" description ":" بسرعة فهم الأشياء والإجراءات والمشاهد والألوان داخل صورة." }]

في هذه الحالة ، لدينا فئة تم تحديدها مع درجة الثقة. أخذ هذه النتيجة في الاعتبار أمر أساسي. عادةً ما أوصي بدرجة ثقة لا تقل عن 95٪. يجب أن ترتفع هذه النتيجة بمرور الوقت حيث تقوم أنت أو مزود واجهة برمجة التطبيقات (API) بإضافة المزيد من بيانات التدريب إلى النماذج.

بالحديث عن بيانات التدريب ، هناك شيء آخر قد ترغب في النظر فيه هو ما إذا كنت ترغب في السماح باستخدام البيانات المرسلة من تطبيقك لتحسين النماذج العامة لمزودك أم لا. إذا كنت ترغب في السماح بذلك ، فأنت بحاجة إلى إعلام المستخدمين لديك صراحةً.

TL ؛ DR:

  • قبل استخدام واجهة برمجة تطبيقات AI ، حدد ما إذا كنت بحاجة إليها حقًا
  • إذا قمت بذلك ، فجرّب موفري خدمة مختلفين وحدد المزود الأنسب لحالة الاستخدام الخاصة بك
  • تأكد من وجود عتبة عالية بما يكفي في درجة الثقة لتجنب الإيجابيات الزائفة

استمتع بغرس الذكاء الاصطناعي في تطبيقاتك!