تحليل صور منتجات باستخدام Node.js و Google Gemini وpuppeteer.

182024-09

تحليل صور منتجات باستخدام Node.js و Google Gemini وpuppeteer.

بسم الله الرحمن الرحيم
In the name of Allah, the Most Gracious, the Most Merciful

عرفت مؤخرا أن الواجهة البرمجية لAPI Google Gemini تتيح استخدام الوسائط كمدخلات (images, vids.. etc)، قمت باستخدام مكتبة puppeteer لأخذ screenshot من أحد كتالوجات منتجات بندة، ثم رفع الصورة إلى Gemini وإرجاع النتائج لمسميات المنتجات، الأسعار والتصنيفات بصيغة json.

هناك الكثير من التحسينات المحتملة لتطبيق لاستخدامه بصورة عملية:

مثلا يمكن تحسين الكود ليقوم بقراءة مسميات المنتجات بصورة أفضل، مثل معالجة الصور لتوضيح النص، يمكن ذلك باستخدام مكتبة مثل sharp.
يمكن أيضا أخذ screenshot لجميع الصفحات في الكاتالوج (الآن يأخذ أول صفحة فقط) و تخزين المخرجات إلى مستند إكسل Google sheets أو تخزينها في "جردل!" AWS S3 Bucket ليتم معالجة البيانات باستخدام الذكاء الصناعي فيما بعد.
يمكن استضافته في serverless environment مثل AWS Lambda أو Cloudflare Workers وتشغيل التطبيق تلقائيا وبصورة دورية حسب الحاجة.. عموما هناك الكثير من التحسينات الممكنة.

ما هي تطبيقات هذه الفكرة؟

مراقبة أسعار السلع والحصول على تنبيهات مؤتمتة.
مقارنة الأسعار بين الشركات.
تحليلات السوق market research.
وغيرها..