وَيْبَاك مَشِين (الإنجليزية: Wayback Machine، ت.ح.: 'آلة الماضي البعيد') هو أرشيف رقمي متجدد للمحتوى الموجود على شبكة الإنترنت بالإضافة إلى معلومات أخرى موجودة على الشبكة، تم إطلاقه في العام 2001 من قبل منظمة أرشيف الإنترنت، وهي منظمة غير ربحية، مقرها سان فرنسسكو، كاليفرنيا، الولايات المتحدة. تهدف هذه المنظمة لتحقيق هدفها المُعلن «وصول عالمي للمعرفة»، تم إعداده بواسطة رواد أعمال الإنترنت بروستر كيل وبروس غيليات وقامت ألكسا إنترنت بالحفاظ على المحتوى الخاص به، هذه الخدمة تمكن المستخدمين من رؤية الإصدارات المحفوظة من صفحات الويب وتغيراتها عبر الزمن، حيث إن الأرشيف يستدعي ما يسمى «فهرسة ثلاثية الأبعاد ».
منذ عام 1996، تم أرشفة الصفحات المخزنة مؤقتاً (cached pages) للمواقع الإلكترونية على مجموعة كبيرة من الكلستر (clusters) لنقط الالتقاء في نظم تشغيل لينكس (Linux nodes).
نبذة تاريخية
أصوله
في عام 1996 قام بروستر كال (Brewster Kahle)، مع بروس جيليات (Bruce Gilliat)، بتطوير وعمل برنامج للزحف (crawl) وتحميل جميع صفحات الشبكة العالمية المتاحة للجمهور.
قدراته التخزينية
اعتبارا من عام 2009، احتوى أرشيف الإنترنت وآي باك مشين على حوالي ثلاثة بيتابايت من البيانات وكان يشهد نمواً ملحوظاً بمعدل 100 تيرابايت كل شهر،
نموه
ما بين أكتوبر 2013 ومارس 2015 تغيرت رتبة المواقع (Websites Ranks) حسب إحصائيات اليكسا العالمية من 162 إلى 208. في مارس 2019، كانت المرتبة في 244.
| السنة | الصفحات المؤرشفة |
|---|---|
| 2004 | 30٬000٬000٬000 |
| 2005 | 40٬000٬000٬000 |
| 2008 | 85٬000٬000٬000 |
| 2012 | 150٬000٬000٬000 |
| 2013 | 373٬000٬000٬000 |
| 2014 | 400٬000٬000٬000 |
| 2015 | 452٬000٬000٬000 |
| 2016 | 459٬000٬000٬000 |
| 2017 | 279٬000٬000٬000 |
| 2018 | 310٬000٬000٬000 |
| 2019 | 345٬000٬000٬000 |
| 2020 | 405٬000٬000٬000 |
| 2021 | 514٬000٬000٬000 |
| 2022 | 640٬000٬000٬000 |
| 2024 | 866٬000٬000٬000 |
استخداماته في الأدلة القانونية
الدعاوى المدنية
في قضية 2009، لشركة كوردينت للبرمجيات (chordiant software Inc) ضد نت بولا أل أل سي (Netbula LLC)، شركة كوردينت المدعى عليها قامت بتقديم مذكرة تجبر نت بولا لتعطيل ملف روبوت دوت تكست (robots.txt) على موقعها على شبكة الإنترنت،
قانون براءة الاختراع
يقوم الأرشيف بالوفاء والإمداد بمتطلبات إضافية فعلى سبيل المثال كتوفير بيانات رسمية عن المحفوظات المؤرشفة، مكتب براءات الاختراع والعلامات التجارية الأمريكي (United States patent office) ومكتب براءات الإختراع الأوروبي (European Patent Office) يمكن أن يقبلوا بيانات من أرشيفات الإنترنت العالمية كدليل عن متى كانت صفحة الوب (webpage) مقدمة للعامة وقابلة للوصول، وتستخدم هذه التواريخ لتحديد ما إذا كانت صفحة الويب متوفرة ويسمى ذلك فن مسبق أو الفن الخفي (Prior art) ويمكن استخدامه في طلب البراءة.
المسائل القانونية للمحتويات المؤرشفة
لقد جلبت عدد من القضايا المرفوعة ضد أرشيف الإنترنت خاصة بعد جهود الأرشفة الموفرة بواسطة أرشيف واي باك مشين
السيانتولوجيا
في أواخر عام 2002، إزالة أرشيف الإنترنت مختلف المواقع التي كانت تنتقد السيانتولوجيا من أرشيف واي باك مشين، وذكرت رسالة خطأ أن هذا كان رداً على «طلب من صاحب الموقع»، في وقت لاحق، تم توضيح من محامين كنيسة السيانتولوجيا وطالبت بإلغاء الإزالة وذكرت أن أصحاب المواقع لا يريدون إزالة الموضوع.
دعاة الرعاية الصحية
في عام 2003، قام كل من هاردينغ إيرلي فولمر (Harding Earley Follmer) وفريلي (Frailey) بالدفاع عن عميل في نزاع علامات تجارية باستخدام أرشيف واي باك مشين، تمكن المحامون من إثبات أن الادعاءات المقدمة من المدعي كانت باطلة وغير صالحة بناء على محتوى موقع الويب الخاصة بهم من عدة سنوات سابقة. المدعي والمدافعين عن الرعاية الصحية قاموا بتعديل شكواهم لتشمل أرشيف الإنترنت، واتهمت المنظمة بالتعدي على حق المؤلف، فضلاً عن انتهاكات قانون الألفية للملكية الرقمية (DMCA) وقانون المعدل لغش الكمبيوتر و إساءة التصرف (Computer Fraud and Abuse Act CFAA)، دعاة الرعاية الصحية يدعون ذلك، لأنه قد ركب ملف روبوت دوت تكست (robots.txt) على الموقع على شبكة الإنترنت حتى لو تم رفع الدعوى الأولية، كان يجب على الأرشيف إزالة جميع النسخ السابقة من موقع المدعي من جهاز واي باك، ومع ذلك، ظلت بعض المواد مرئية للجمهور على واي باك مشين. تمت تسوية الدعوى خارج المحكمة، بعد إصلاح واي باك المشكلة
انظر أيضا
آلة العودة بالزمن (Wayback Machine)استلهمت منظمة أرشيف الإنترنت اسم خدمة أرشفة الويب الخاصة بها من برنامج الرسوم المتحركة «The Adventure of Rocky and Bullwinkle» والذي ظهرت فيه آلة زمن تدعى «WABAC Machine»، ومن هنا قررت المؤسسة إطلاق اسم «Wayback Machine» على تلك الخدمة.
وآلة العودة بالزمن هي خدمة تتيح لمستخدمي الإنترنت أن يتصفحوا النسخ المؤرشفة من بعض صفحات الويب، وهي مفهرسة كذلك مما يسهل عملية البحث. حيث تقوم تلك الخدمة بأرشفة وفهرسة بعض صفحات الويب دوريًا، وتعرضها مجانًا للعامة. وقد تعاونت منظمة أرشيف الإنترنت مع شركة أليكسا إنترنت لتنفيذ هذا المشروع عن طريق تطوير مؤشر ثلاثي الأبعاد يسمح بتصفح محتويات الويب المؤرشفة. ومنذ ذلك الحين وحتى الآن تم حفظ الملايين من صفحات الويب ومحتوياتها الملحقة (صور، أكواد المصدر، وثائق...إلخ) في قواعد البيانات الخاصة بهم. وتتيح الخدمة عرض محتويات النسخ القديمة من صفحات الويب الحالية بالإضافة إلى أكوادها البرمجية، وكذلك الأمر مع صفحات الويب التي لم يعد لها وجود من الأساس، ومع المواقع الإلكترونية التي لم تعد متاحة بشكل مباشر. ولا تتضمن قواعد البيانات جميع صفحات الويب في المطلق، حيث رفض الكثير من أصحاب المواقع الإلكترونية تسجيل محتويات صفحاتهم. وبما أن تلك الخدمة تعتمد على زواحف الشبكات في تكوين قواعد البيانات، فهي تفتقد جزءًا كبيرًا من الويب لأسباب عديدة. وقد وجدت دراسة أجريت عام 2004 وجود تحيزات على نطاق دولي من حيث مدى تغطية الخدمة، ولكن على ما يبدو أن هذه التحيزات ليست مقصودة.
ومن ثم شاع استخدام خدمة ال ـ«Wayback Machine» في الأدبيات المعاصرة؛ ففي أحد حلقات البرنامج التلفزيوني «Law and Order: Criminal Intent» (القانون والنظام: نية إجرامية)، استخدم موظف الحاسوب خدمة آلة العودة بالزمن لإيجاد نسخة مؤرشفة من موقع ويب ينتمي لأحد الطلاب.
وفي السابق كانت صفحات الويب تنتظر فترة تتراوح من 6 إلى 18 شهر حتى يتم أرشفتها، ولكن في نهاية المطاف تم السماح لمواقع الويب أن تًضاف إلى قواعد البيانات فوريًا عند الطلب. ثم أضيفت خدمة أرشفة الصفحات الفورية في أكتوبر 2013، والتي يمكن الوصول إليها في الركن السفلي الأيمن من الصفحة الرئيسية. ففي اللحظة التي تدخل فيها عنوان الموقع الإلكتروني المرغوب، يتم إدراج محتويات الموقع إلى قاعدة البيانات على الفور. وعن طريق عنوان موقع الخدمة (web.archive.org) يتاح للمستخدمين رفع أنواع متعددة من المحتويات إلى خدمة ال ـ«Wayback Machine»، مما يشمل ملفات.pdf وجميع امتدادات الملفات المضغوطة.
و 12 مايو 1996 هو تاريخ إنشاء أقدم نسخ مؤرشفة من صفحات الويب على ال ـ«Wayback Machine»، ومن بينها موقع infoseek.com. وفي أكتوبر 2016، تم إعلان تغيير نظام حساب عدد الصفحات المؤرشفة، مما أدى إلى انخفاض تعداد الصفحات المؤرشفة.
مُجمّع الكتب الرقمي
أرشيف النصوص
تحتوي خدمة أرشفة النصوص التابعة لأرشيف الإنترنت على نسخ رقمية من العديد من الكتب بالإضافة إلى تشكيلة خاصة من محتويات المكتبات الكبرى ومؤسسات التراث الثقافي من جميع أرجاء العالم. حيث تمتلك منظمة أرشيف الإنترنت 33 مركز مسح ضوئي في 5 دول مختلفة، وهي تعمل بلا انقطاع على مسح 1000 كتابًا بصفة يومية، بعدد كلي يتجاوز مليوني كتاب. وتتكفل المكتبات والمؤسسات المعنية بتمويل هذه المراكز. وبحلول عام 2013 شملت تجميعة الكتب 4.4 مليون كتابًا، مع 15 مليون عملية تنزيل كل شهر. وفي عام 2008، حينما وصل عدد الكتب إلى مليون كتاب، شغلت المجموعة الكاملة مساحة 0.5 بيتابايت، وهي تشمل الصور الخام، والصور المعدلة، وملفات ال PDF، وملفات التعرف على الحروف (OCR).
وفي الفترة من 2006 إلى 2008، دشنت ميكروسوفت مشروعًا جديدًا بهدف تسهيل البحث عن الكتب وأطلقت عليه اسم (Live Search Books)، وذلك بالتعاون مع أرشيف الإنترنت، وتضمن المشروع مسح 300,000 كتابًا أضيفت إلى التجميعة الرئيسية الخاصة بأرشيف الإنترنت، مع تقديم دعم مالي وتوفير معدات المسح. ولكن في 23 مايو 2008، أعلنت ميكروسوفت عن إنهاء المشروع وتوقف عمليات مسح الكتب. ثم أتاحت ميكروسوفت الوصول إلى تلك الكتب بدون أي قيود تعاقدية، وتبرعت بمعداتها إلى شركائها السابقين.
العمليات
الأرشيف هو منظمة 501(سي)(3) غير ربحية عاملة في الولايات المتحدة. يملك ميزانية سنوية قدرها عشرة ملايين دولار، مستمدة من مجموعة متنوعة من المصادر: الإيرادات من خدمات الزحف إلى صفحات الويب، والشراكات المختلفة، والمنح، والتبرعات، ومؤسسة كيل أوستن. يدير أرشيف الإنترنت حملات تمويل دورية، مثل تلك التي بدأت في ديسمبر عام 2019 بهدف الوصول إلى تبرعات بمبلغ 6 ملايين دولار.
مقره المنظمة الرئيسي في سان فرانسيسكو، في كاليفورنيا. ظل مقر المكتب الرئيسي في بريسيديو في سان فرانسيسكو وهي قاعدة عسكرية أمريكية سابقة، من عام 1996 وحتى عام 2009. يقع المقر الرئيسي في جادة فانستون 300 في سان فرانسيسكو، وهي كنيسة علوم مسيحية سابقة، وذلك منذ عام 2009.
عمل غالبية موظفي الأرشيف في مراكز مسح الكتب معظم الوقت، ولكن بات المسح يُنجز بواسطة مئة مشغّل مدفوع الأجر في جميع أنحاء العالم، اعتبارا من عام 2019. يملك الأرشيف مراكز بيانات في ثلاث مدن في كاليفورنيا: سان فرانسيسكو، وريدوود سيتي، وريتشموند. يحاول الأرشيف وضع نسخ (أجزاء) من المجموعة في مواقع أبعد، مثل مكتبة الإسكندرية في مصر ومرفق في أمستردام، لمنع فقدان البيانات في بعض الحالات مثل الكوارث الطبيعية. الأرشيف عضو في الاتحاد الدولي للحفاظ على الإنترنت، وعُيّن رسميًا كمكتبة من قبل ولاية كاليفورنيا في عام 2007.
لمحة تاريخية
أسس بروستر كيل الأرشيف في مايو عام 1996، تقريبًا في نفس الوقت الذي أنشأ فيه شركة أليكسا إنترنت الربحية للزحف إلى صفحات الويب. بدأ أرشيف الإنترنت في أرشفة شبكة الويب العالمية وتخزينها بكميات كبيرة في أكتوبر عام 1996، على الرغم من أنه حفظ الصفحات الأولى في مايو عام 1996. لم يكن المحتوى المؤرشف متاحًا لعامة الناس حتى عام 2001، عندما طور أرشيف العودة بالزمن.
وسّع الأرشيف مجموعاته بالإضافة إلى أرشيف الويب، بدايةً من محفوظات بريلنغر، في أواخر عام 1999. يحتوي أرشيف الإنترنت حاليًا على نصوص وصوتيات وصور متحركة وبرامج، ويستضيف عددًا من المشاريع الأخرى: أرشيف صور ناسا، وخدمة الزحف إلى العقود «أأركايف إت» وفهرس مكتبة ويكي للتحرير، وموقع معلومات الكتب «المكتبة المفتوحة». بدأ الأرشيف بعد ذلك بفترة وجيزة في العمل على توفير خدمات متخصصة تتعلق باحتياجات الوصول إلى المعلومات من أجل الأشخاص العاجزين عن قراءة المطبوعات، وأُتيحت الكتب لتصبح بمتناول الجمهور بشكل نُظم معلومات رقمية متاحة محمية (دي إيه آي إس واي).
وفقًا لموقع الأرشيف على الويب:
«تولي معظم المجتمعات أهمية للحفاظ على تحف ثقافتها وتراثها. لا يوجد للحضارة ذاكرة ولا آلية للتعلم من نجاحاتها وإخفاقاتها، دون هذه التحف. ثقافتنا تنتج اليوم المزيد والمزيد من التحف بصورة رقمية. مهمة الأرشيف هي المساعدة في الحفاظ على تلك التحف وإنشاء مكتبة على الإنترنت للباحثين والمؤرخين والعلماء».
ليست هناك تعليقات:
إرسال تعليق