تكافح ويكيبيديا مع زيادة النطاق الترددي والتكاليف بسبب روبوتات الذكاء الاصطناعي
حذرت المنظمة غير الربحية ، التي تدير ويكيبيديا ، من أن متصفحات الذكاء الاصطناعى تستهلك عرض النطاق الترددي للموقع وزيادة التكاليف. وقال: "المحتوى الخاص بنا مجاني ، وليس بنيتنا التحتية".

عرض النطاق الترددي لـ Wikipedia عند الحد
تدفع Wikipedia سعر انفجار الذكاء الاصطناعي: تواجه الموسوعة عبر الإنترنت تكاليف متزايدة بسبب الأحذية المستخدمة لتدريب نماذج الذكاء الاصطناعي عن طريق مسح مقالاتها وهذا الموقف يجبر النطاق الترددي للموقع.
يوم الثلاثاء ، منظمة ويكيبيديا ، غير ربحية ، "تزداد المطالب التلقائية لمحتوىنا بشكل كبير" ، قال. يمكن أن يقطع هذا الوصول إلى الموقع ويزيد من قدرة موقع الموسوعة لزيادة قدرة مركز بيانات ويكيبيديا.
غير مستعدة لزيادة حركة المرور المفاجئة
وفقًا للمؤسسة ، "منذ يناير 2024 ، رأينا أن النطاق الترددي المستخدم في تقليل محتوى الوسائط المتعددة قد زاد بنسبة 50 ٪." ومع ذلك ، فإن حركة المرور تأتي من البرامج التلقائية التي تنزيل باستمرار الصور المرخصة المفتوحة لتوفير صور لنماذج الذكاء الاصطناعى ، وليس من القراء البشريين.
حتى المقالات الأقل شعبية على الهدف
مشكلة أخرى هي أن الأحذية تجمع البيانات من مقالات ويكيبيديا ، والتي عادة ما تكون أقل شعبية. "عندما ندرسها عن كثب ، وجدنا أن ما لا يقل عن 65 ٪ من حركة المرور المستهلكة من القوارب جاءت من الأحذية ، بينما ندرس حوالي 35 ٪ من إجمالي مشاهدات الصفحة للموقع." قال.
الروبوتات ، حتى إجبار موارد الموقع ، حتى أنها تفحص الأنظمة الرئيسية في البنية التحتية للمطورين لدينا ، مثل "منصة مراجعة الكود أو عارض الخطأ". استجابة لهذا الموقف ، جلب مديرو المواقع في ويكيبيديا قيود السرعة أو حتى حظرهم لمتصفحات الذكاء الاصطناعى مشكلة. ومع ذلك ، من أجل حل المشكلة على المدى الطويل ، تقوم مؤسسة ويكيميديا بتطوير "الاستخدام المسؤول لخطة البنية التحتية" ويذكر أن تحميل الشبكة الناجم عن متصفحات روبوت الذكاء الاصطناعى "غير مستدام".
من المتوقع من المجتمع من المجتمع
Foundation لجمع التعليقات على أفضل الطرق لتحديد وتصفية حركة المرور من مجتمع ويكيبيديا من ماسحات بوت الذكاء الاصطناعي. يتضمن ذلك مطالبة مشغلي القوارب بالخضوع للمصادقة للمسح الضوئي المرتفع واستخدام API. الأساس ، "المحتوى الخاص بنا مجاني ، وليس بنيتنا التحتية: الآن لإعادة توازن صحي G "أضاف".
مشكلة مماثلة من Reddit
واجه Reddit معضلة مماثلة في عام 2023. على سبيل المثال ، لم يبلغ Microsoft Reddit أن Reddit قام بمسح محتواها واستخدمها لميزات الذكاء الاصطناعي. في وقت لاحق ، منع Reddit موقع Microsoft من Scanning ، وصفه ستيف هوفمان الرئيس التنفيذي لشركة Reddit بأنه "آفة حقيقية".
قرر Reddit أيضًا شحن وصول API من مطوري البارتي الثالث. أدى هذا القرار إلى تمرد المطور ، وتظليل subreddit وإغلاق بعض عملاء Reddit الشعبية.
ما هو رد فعلك؟






